经验分享

免费AI大模型API官网和文档汇总

我的站长站 2025-06-28 人阅读

免费AI大模型API官网和文档汇总是提供给用户一个访问和使用人工智能服务的平台。该平台汇集了众多热门的AI大模型API,用户可以根据自己的需求选择适合的模型进行开发和测试。同时,网站还提供了详细的API文档,帮助用户更好地理解和使用这些API,从而提高工作效率和创新能力。

大模型免费版本免费限制官网文档
讯飞星火大模型spark-lite

tokens:总量无限;

QPS:2;(每秒发送的请求数)

有效期:不限

官网文档
百度千帆大模型平台ERNIE-Speed-8K

RPM = 300,TPM= 300000

(RPM是每分钟请求数(Requests Per Minute),TPM是指每分钟处理的tokens数量)

官网文档
ERNIE-Speed-128KRPM = 60,TPM = 300000
ERNIE-Lite-8K-0922RPM = 300,TPM = 300000
ERNIE-Lite-8KRPM = 300,TPM = 300000
ERNIE-Tiny-8KRPM = 300,TPM = 300000
腾讯混元大模型hunyuan-lite限制并发数为 5 路官网文档
字节扣子(coze.cn)豆包·Function call模型(32K)当前扣子 API 免费供开发者使用,每个空间的 API 请求限额如下:
QPS (每秒发送的请求数):2
QPM (每分钟发送的请求数):60
QPD (每天发送的请求数):3000
官网文档
通义千问-Max(8K)
MiniMax 6.5s(245K)
Moonshot(8K)
Moonshot(32K)
Moonshot(128K)
Llama FamilyAtom-13B-Chat1.每天 8-22 点:接口限速每分钟 20 次并发
2.每天 22-次日 8 点:接口限速每分钟 50 次并发
官网暂无
Atom-7B-Chat
Atom-1B-Chat
Llama3-Chinese-8B-Instruct
groqgemma-7b-it

rpm为30,

rpd为14400,

TOKENS PER MINUTE也有限制

官网文档
mixtral-8x7b-32768
llama3-70b-8192
llama3-8b-8192
Google Geminigemini-1.5-pro

15RPM(每分钟请求数);

100万 TPM(每分钟tokens);

1500 RPD(每天请求数)

官网文档
gemini-1.5-flash
gemini-1.0-pro
gemini-pro-vision
硅基流动Qwen2-7B-Instruct

RPM限制为100,

QPS限制为3,

更多可以进行申请

官网暂无
Qwen2-1.5B-Instruct
Qwen1.5-7B-Chat
glm-4-9b-chat
chatglm3-6b
Yi-1.5-9B-Chat-16K
Yi-1.5-6B-Chat
IT开发经验分享标签