本文按模型厂商梳理主流大语言模型 API 的最新定价,涵盖 DeepSeek、OpenAI、通义千问、文心一言、豆包、ChatGLM 等,帮助开发者和企业快速选型。

更新日期:2026 年 6 月


一、国内模型 API 价格

1.1 DeepSeek

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
DeepSeek V3.1 2 8 128K 旗舰模型,综合能力最强
DeepSeek V3 2 8 64K 性价比之选
DeepSeek R1 4 16 64K 推理增强,数学/编程强

1.2 通义千问(阿里云 DashScope)

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
Qwen3-235B 4 16 128K 旗舰,235B 参数
Qwen-Turbo 2 6 128K 性价比型
Qwen-Plus 0.8 2 128K 轻量高效
Qwen-Long 0.5 2 1M 超长上下文
Qwen-VL-Max 3 9 32K 视觉理解

1.3 文心一言(百度智能云)

模型 输入价格(元/千 Token) 输出价格(元/千 Token) 上下文窗口 说明
ERNIE 4.5 0.12 0.24 128K 旗舰模型
ERNIE 4.0 Turbo 0.03 0.06 128K 高性价比
ERNIE Speed 免费 免费 8K 轻量免费版
ERNIE-Lite 免费 免费 8K 极致轻量

1.4 豆包(字节跳动火山引擎)

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
Doubao-Pro-32K 0.8 2 32K 主力模型
Doubao-Pro-128K 5 9 128K 长上下文
Doubao-Lite-32K 0.3 0.6 32K 轻量
Doubao-Seedance 按秒计费 - - 视频生成

1.5 ChatGLM(智谱 AI)

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
GLM-4-Plus 5 5 128K 旗舰模型
GLM-4-Air 0.5 0.5 128K 高性价比
GLM-4-Flash 免费 免费 128K 免费版

1.6 其他国内模型

厂商 代表模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 说明
Moonshot/Kimi Moonshot-v1-128K 12 12 长文本专长
零一万物 Yi-Large 10 10 中英双语
MiniMax abab6.5s 5 5 多模态
讯飞星火 Spark 4.0 0.1 元/千 Token 0.1 元/千 Token 语音交互强

二、国外模型 API 价格

2.1 OpenAI

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
GPT-4o 17.5 70 128K 多模态旗舰
GPT-4o-mini 1.05 4.2 128K 高性价比
o3-mini 7.7 30.8 200K 推理模型
GPT-4.1 14 56 1M 超长上下文

2.2 Anthropic Claude

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
Claude Opus 4.5 105 350 200K 最强旗舰
Claude Sonnet 4.5 21 70 200K 均衡之选
Claude Haiku 3.5 5.6 28 200K 轻量快速

2.3 Google Gemini

模型 输入价格(元/百万 Token) 输出价格(元/百万 Token) 上下文窗口 说明
Gemini 2.5 Pro 8.75 43.75 1M 旗舰
Gemini 2.5 Flash 1.05 4.2 1M 速度优先

三、性价比速查

同价位横向对比(以 128K 上下文、100 万 Token 输出为基准)

价格区间 代表模型 适合场景
免费 ChatGLM-Flash、ERNIE Speed、ERNIE-Lite 个人测试、轻量对话
极低价(< 2元/百万) DeepSeek V3.1(8元)、Qwen-Plus(2元)、Doubao-Pro(2元)、GPT-4o-mini(4.2元) 大批量调用、创业项目
性价比档(2-10元) DeepSeek R1(16元)、Qwen3(16元)、Doubao-Pro-128K(9元) 生产环境主力
高端档(> 50元) GPT-4o(70元)、Claude Opus(350元) 复杂推理、专业创作

性价比 Top 5(综合价格与能力)

排名 模型 输出价格 推荐理由
1 DeepSeek V3.1 8 元/百万 Token 能力接近 GPT-4o,价格仅 1/9
2 Qwen-Turbo 6 元/百万 Token 阿里生态,中文能力突出
3 GPT-4o-mini 4.2 元/百万 Token 小任务首选,速度快
4 Doubao-Pro-32K 2 元/百万 Token 豆包生态,超低价格
5 GLM-4-Air 0.5 元/百万 Token 中文友好,价格极低

四、省钱实战策略

4.1 按场景选模型

日常对话、客服   → Doubao-Pro / GPT-4o-mini(成本极低)
代码生成、编程   → DeepSeek V3.1 / Claude Sonnet
中文创作、翻译   → 通义千问 Qwen-Turbo / ChatGLM-4-Air
复杂推理、分析   → DeepSeek R1 / o3-mini
多模态理解       → GPT-4o / Qwen-VL-Max
视频生成         → Doubao-Seedance / 可灵

4.2 三个省钱技巧

技巧一:利用统一 API 网关动态路由

不同模型价差可达几十倍。通过 API 网关按请求复杂度自动路由:

# 简单问题走便宜模型,复杂问题走强模型
def route_model(question: str) -> str:
    if len(question) < 100 and "推理" not in question:
        return "doubao-pro-32k"      # 2 元/百万
    elif "代码" in question or "编程" in question:
        return "deepseek-chat"        # 8 元/百万
    else:
        return "qwen-turbo"           # 6 元/百万

技巧二:缓存常见问题

简单重复的查询(如 FAQ、产品介绍)命中缓存后直接返回,完全不走模型调用,成本降为零。

技巧三:选择合适的上下文窗口

长上下文价格更贵。大多数对话场景 32K 就够了,不需要为 128K 或 1M 窗口付费。评估实际需求再选。

4.3 如何用一个 Key 调用以上所有模型?

看完几十个模型的价格和协议,你应该已经发现了——

  • DeepSeek 用 OpenAI 协议,但 Key 要去 DeepSeek 官网申请
  • 通义千问用 DashScope 自有协议,Key 去阿里云申请
  • 文心一言又是另一套鉴权方式,Key 去百度云申请
  • OpenAI、Claude 还要解决跨境支付……

每接入一个新模型,就要注册一个新平台、充值一个新账户、对接一套新协议。

一种更省事的方式是走统一 API 网关:一个 API Key 覆盖上述所有模型,按实际用量统一计费,不用在各个平台之间来回切。目前国内已有平台在做这件事——比如星枢无极,兼容 OpenAI 协议,后端对接了 40+ 国内外模型,前端对开发者只暴露一个统一端点。切换模型只需改 model 参数,成本和 Token 消耗在一个后台统一查看。

对于需要多模型 A/B 测试、自动降级、成本对比的团队来说,这比逐个平台对接高效得多。


五、选择困难?一张图帮你决策

你的需求是什么?
├── 我有预算限制,要最便宜的
│   ├── 所有场景通用 → GLM-4-Air(0.5 元/百万,极低价)
│   ├── 要免费试水 → ChatGLM-Flash / 文心 ERNIE Speed
│   └── 还是要强一点 → GPT-4o-mini(4.2 元/百万,性能不差)
│
├── 我要综合最强,价格不太敏感
│   ├── 英文场景 → Claude Sonnet 4.5(21 元/百万)
│   ├── 中文场景 → DeepSeek V3.1(8 元/百万)
│   └── 多模态 → GPT-4o(70 元/百万)
│
├── 我要中文最懂中国用户的
│   ├── 首选 → 通义千问 Qwen-Turbo / DeepSeek V3.1
│   └── 备选 → ChatGLM-4-Air
│
└── 我只关心代码能力
    ├── 编程首选 → DeepSeek V3.1 / Claude Sonnet
    └── 推理最强 → DeepSeek R1 / o3-mini

六、注意事项

  • 价格波动:模型厂商经常调价(通常是降价),本文每月更新一次,建议收藏
  • 计费差异:部分厂商按输入+输出分别计费(如 DeepSeek、OpenAI),部分输入输出同价(如 ChatGLM),计算总成本时注意区分
  • 免费版限制:免费模型通常有 QPS(每秒请求数)和总调用量限制,生产环境谨慎使用
  • 汇率换算:国外模型以美元定价,本文按 1 USD ≈ 7 CNY 换算
  • 协议差异:各厂商 API 格式不统一,用统一网关可以避免对接多套协议的成本

本文数据截至 2026 年 6 月。实际价格以各厂商官网为准。如需通过单一端点访问上述全部模型的 API,可了解支持 OpenAI 协议兼容的模型中转服务。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐