AI 模型 API 价格一览（实时更新）

qq_40748277

406人浏览 · 2026-06-25 17:42:03

qq_40748277 · 2026-06-25 17:42:03 发布

本文按模型厂商梳理主流大语言模型 API 的最新定价，涵盖 DeepSeek、OpenAI、通义千问、文心一言、豆包、ChatGLM 等，帮助开发者和企业快速选型。

更新日期：2026 年 6 月

一、国内模型 API 价格

1.1 DeepSeek

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
DeepSeek V3.1	2	8	128K	旗舰模型，综合能力最强
DeepSeek V3	2	8	64K	性价比之选
DeepSeek R1	4	16	64K	推理增强，数学/编程强

1.2 通义千问（阿里云 DashScope）

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
Qwen3-235B	4	16	128K	旗舰，235B 参数
Qwen-Turbo	2	6	128K	性价比型
Qwen-Plus	0.8	2	128K	轻量高效
Qwen-Long	0.5	2	1M	超长上下文
Qwen-VL-Max	3	9	32K	视觉理解

1.3 文心一言（百度智能云）

模型	输入价格（元/千 Token）	输出价格（元/千 Token）	上下文窗口	说明
ERNIE 4.5	0.12	0.24	128K	旗舰模型
ERNIE 4.0 Turbo	0.03	0.06	128K	高性价比
ERNIE Speed	免费	免费	8K	轻量免费版
ERNIE-Lite	免费	免费	8K	极致轻量

1.4 豆包（字节跳动火山引擎）

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
Doubao-Pro-32K	0.8	2	32K	主力模型
Doubao-Pro-128K	5	9	128K	长上下文
Doubao-Lite-32K	0.3	0.6	32K	轻量
Doubao-Seedance	按秒计费	-	-	视频生成

1.5 ChatGLM（智谱 AI）

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
GLM-4-Plus	5	5	128K	旗舰模型
GLM-4-Air	0.5	0.5	128K	高性价比
GLM-4-Flash	免费	免费	128K	免费版

1.6 其他国内模型

厂商	代表模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	说明
Moonshot/Kimi	Moonshot-v1-128K	12	12	长文本专长
零一万物	Yi-Large	10	10	中英双语
MiniMax	abab6.5s	5	5	多模态
讯飞星火	Spark 4.0	0.1 元/千 Token	0.1 元/千 Token	语音交互强

二、国外模型 API 价格

2.1 OpenAI

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
GPT-4o	17.5	70	128K	多模态旗舰
GPT-4o-mini	1.05	4.2	128K	高性价比
o3-mini	7.7	30.8	200K	推理模型
GPT-4.1	14	56	1M	超长上下文

2.2 Anthropic Claude

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
Claude Opus 4.5	105	350	200K	最强旗舰
Claude Sonnet 4.5	21	70	200K	均衡之选
Claude Haiku 3.5	5.6	28	200K	轻量快速

2.3 Google Gemini

模型	输入价格（元/百万 Token）	输出价格（元/百万 Token）	上下文窗口	说明
Gemini 2.5 Pro	8.75	43.75	1M	旗舰
Gemini 2.5 Flash	1.05	4.2	1M	速度优先

三、性价比速查

同价位横向对比（以 128K 上下文、100 万 Token 输出为基准）

价格区间	代表模型	适合场景
免费	ChatGLM-Flash、ERNIE Speed、ERNIE-Lite	个人测试、轻量对话
极低价（< 2元/百万）	DeepSeek V3.1(8元)、Qwen-Plus(2元)、Doubao-Pro(2元)、GPT-4o-mini(4.2元)	大批量调用、创业项目
性价比档（2-10元）	DeepSeek R1(16元)、Qwen3(16元)、Doubao-Pro-128K(9元)	生产环境主力
高端档（> 50元）	GPT-4o(70元)、Claude Opus(350元)	复杂推理、专业创作

性价比 Top 5（综合价格与能力）

排名	模型	输出价格	推荐理由
1	DeepSeek V3.1	8 元/百万 Token	能力接近 GPT-4o，价格仅 1/9
2	Qwen-Turbo	6 元/百万 Token	阿里生态，中文能力突出
3	GPT-4o-mini	4.2 元/百万 Token	小任务首选，速度快
4	Doubao-Pro-32K	2 元/百万 Token	豆包生态，超低价格
5	GLM-4-Air	0.5 元/百万 Token	中文友好，价格极低

四、省钱实战策略

4.1 按场景选模型

日常对话、客服   → Doubao-Pro / GPT-4o-mini（成本极低）
代码生成、编程   → DeepSeek V3.1 / Claude Sonnet
中文创作、翻译   → 通义千问 Qwen-Turbo / ChatGLM-4-Air
复杂推理、分析   → DeepSeek R1 / o3-mini
多模态理解       → GPT-4o / Qwen-VL-Max
视频生成         → Doubao-Seedance / 可灵

4.2 三个省钱技巧

技巧一：利用统一 API 网关动态路由

不同模型价差可达几十倍。通过 API 网关按请求复杂度自动路由：

# 简单问题走便宜模型，复杂问题走强模型
def route_model(question: str) -> str:
    if len(question) < 100 and "推理" not in question:
        return "doubao-pro-32k"      # 2 元/百万
    elif "代码" in question or "编程" in question:
        return "deepseek-chat"        # 8 元/百万
    else:
        return "qwen-turbo"           # 6 元/百万

技巧二：缓存常见问题

简单重复的查询（如 FAQ、产品介绍）命中缓存后直接返回，完全不走模型调用，成本降为零。

技巧三：选择合适的上下文窗口

长上下文价格更贵。大多数对话场景 32K 就够了，不需要为 128K 或 1M 窗口付费。评估实际需求再选。

4.3 如何用一个 Key 调用以上所有模型？

看完几十个模型的价格和协议，你应该已经发现了——

DeepSeek 用 OpenAI 协议，但 Key 要去 DeepSeek 官网申请
通义千问用 DashScope 自有协议，Key 去阿里云申请
文心一言又是另一套鉴权方式，Key 去百度云申请
OpenAI、Claude 还要解决跨境支付……

每接入一个新模型，就要注册一个新平台、充值一个新账户、对接一套新协议。

一种更省事的方式是走统一 API 网关：一个 API Key 覆盖上述所有模型，按实际用量统一计费，不用在各个平台之间来回切。目前国内已有平台在做这件事——比如星枢无极，兼容 OpenAI 协议，后端对接了 40+ 国内外模型，前端对开发者只暴露一个统一端点。切换模型只需改 model 参数，成本和 Token 消耗在一个后台统一查看。

对于需要多模型 A/B 测试、自动降级、成本对比的团队来说，这比逐个平台对接高效得多。

五、选择困难？一张图帮你决策

你的需求是什么？
├── 我有预算限制，要最便宜的
│   ├── 所有场景通用 → GLM-4-Air（0.5 元/百万，极低价）
│   ├── 要免费试水 → ChatGLM-Flash / 文心 ERNIE Speed
│   └── 还是要强一点 → GPT-4o-mini（4.2 元/百万，性能不差）
│
├── 我要综合最强，价格不太敏感
│   ├── 英文场景 → Claude Sonnet 4.5（21 元/百万）
│   ├── 中文场景 → DeepSeek V3.1（8 元/百万）
│   └── 多模态 → GPT-4o（70 元/百万）
│
├── 我要中文最懂中国用户的
│   ├── 首选 → 通义千问 Qwen-Turbo / DeepSeek V3.1
│   └── 备选 → ChatGLM-4-Air
│
└── 我只关心代码能力
    ├── 编程首选 → DeepSeek V3.1 / Claude Sonnet
    └── 推理最强 → DeepSeek R1 / o3-mini

六、注意事项

价格波动：模型厂商经常调价（通常是降价），本文每月更新一次，建议收藏
计费差异：部分厂商按输入+输出分别计费（如 DeepSeek、OpenAI），部分输入输出同价（如 ChatGLM），计算总成本时注意区分
免费版限制：免费模型通常有 QPS（每秒请求数）和总调用量限制，生产环境谨慎使用
汇率换算：国外模型以美元定价，本文按 1 USD ≈ 7 CNY 换算
协议差异：各厂商 API 格式不统一，用统一网关可以避免对接多套协议的成本

本文数据截至 2026 年 6 月。实际价格以各厂商官网为准。如需通过单一端点访问上述全部模型的 API，可了解支持 OpenAI 协议兼容的模型中转服务。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

Codex 完整使用教程（Windows/macOS 双系统区别详解）

智能体开发者社区

[智能体-640]：Openclaw自动实时备份workspace空间中的内容到gitee仓库的本质与步骤

OpenClaw 的 workspace 是存放全部智能体配置资产的核心目录，包含 SOUL.md、AGENTS.md、技能配置、记忆日志、业务流程、自然语言编排脚本等整套数字公司核心资产，是硅基组织的全部源代码与经营档案。自动实时备份至 Gitee，本质是一套内置轻量化 Git 自动化调度链路：依托智能体引擎内置Git 客户端、定时 / 事件触发器监控 workspace 文件变动，自动执行完整