为了查Claude Opus 4.8 价格，我连续打开了 20 多个网站

okenai

553人浏览 · 2026-06-04 15:24:22

okenai · 2026-06-04 15:24:22 发布

事情是怎么开始的

一个很普通的问题

最近Claude官方不是发布了claude-opus-4.8嘛，我就想着去查一下价格，我打开官网---看价格--结束。价格确实很美丽，但是我的钱包很差劲，思来想去我便开始走上了“不归路”。

于是我开始在浏览器里面一个个搜：

Claude
Azure
Anthropic
各种聚合平台
各种 API 中转站
.....

打开第20个网页的时候

我开始怀疑人生了，开始不相信我的眼睛，开始几个网页来回跳转对不，明明是同一个模型，不同的平台

为什么价格完全不一样？

我发现了一个离谱现象

同一个claude-opus-4.8 ，价格差几十倍

平台	输入价(M)	输出价(M)	缓存价(M)
平台1	¥0.80	¥4	¥0.08
平台2	¥1	¥5	¥0.10
平台3	¥1	¥5	¥0.10
平台4	¥1.50	¥7.50	¥0.15
平台5	¥2.25	¥11.25	¥0.23
平台6	¥2.50	¥12.50	—
平台7	¥2.50	¥12.50	¥0.25
平台8	¥3	¥15	¥0.30
平台9	¥3	¥15	¥0.30
平台10	¥3.18	¥15.90	¥0.32
平台11	¥3.90	¥19.50	¥0.39
平台12	¥4	¥20	¥0.40
平台13	¥4.08	¥20.40	¥0.41
平台14	¥4.80	¥24	¥0.48
平台15	¥4.80	¥24	¥0.48
平台16	¥4.80	¥24	¥0.48
平台17	¥5	¥25	—
平台18	¥5	¥25	¥0.50
平台19	¥5.40	¥27	¥0.54
平台20	¥8	¥40	¥0.80
平台21	¥15.75	¥78.75	¥1.57
平台22	¥20.75	¥103.75	¥2.08
平台23	¥25	¥125	¥2.50
平台24（官网）	¥33.85	¥169.24	¥33.80

最低的输入价是0.8，最高的是官网33.85，其他的基本上都在1-8之间，只有少数几家是在15-25，就一个模型就有这么多不同的价格

一开始我以为有人标错了

来来回回看了好几遍，才发现原来

问题出在：

来源不同：我表格中记录的这些有官网和中转，还有三方聚合的
线路不同：线路我没有写出来，但是大概有20多条线路
计费方式不同：有些平台有起充门槛，价格就相对便宜点，但是如果是第一次接触到这个平台，很少有人一上来就充个大几十或者是大几百的，基本上都是要充小部分试一下的，有些平台起充就是1元，但是模型的价格相对会贵一点

价格背后到底差在哪

我把我看过的网页做了一下简单的分类，主要有以下4类:

1.官方

最容易理解，简单来讲就是直接向模型厂商购买，比如国外的OpenAI、Anthropic ，国内的deepseek
特点

来源最明确

稳定性通常最好

文档最完善

价格一般也是最高

售后也更有保障

适合

企业客户

对稳定性要求高的团队

2.云服务商

云厂商把模型接进自己的平台，例如国外Azure、AWS、Google Cloud ，国内阿里云，火山云等
特点

统一管理方便

可以和现有云服务一起使用

企业采购流程比较成熟

适合：

已经在使用云服务的团队

3.聚合平台

把多个模型厂商的能力聚合到一个平台，一个账号就能调用多个模型。比如硅基流动
特点

接入方便

支持模型多

不需要分别注册多个账号

价格通常介于官方和中转之间

适合：

开发者

创业团队

需要频繁切换模型的人

4.中转服务

通过兼容接口、转发线路或二次封装的方式提供模型能力，也是目前市场上价格差异最大的部分。
特点

价格跨度非常大

有的比官网便宜很多

有的甚至比官网更贵

稳定性差异也比较明显

适合：

对成本比较敏感的用户

个人创业者

于是我开始整理数据

最开始我只是想简单的记录一下，主要是为了方便自己查询

就只记录：

模型
输入价格
输出价格
缓存价格
平台

可是到后面越整理越多，从几个模型，变成几十个模型，从几个平台变成几十个平台。直到有一次和朋友聊天才知道原来很多人都在重复做同样的事情。

每次选模型：

查价格。

查平台。

查稳定性。

查支持情况。

大家都在重复劳动，每次也都要来来回回去对比。

比价格更有意思的发现

最便宜的不一定最省钱

其实一开始我最关注的是输入价格，谁便宜就排前面，后来发现事情没这么简单。

举个例子，我统计的 24 个平台里。平台1的输入价格只有：¥0.8 / 百万 Token；而平台24的价格是：

¥33.85 / 百万 Token，两者相差超过 42 倍。看到这里很多人第一反应都是：

那肯定选平台1

我一开始也是这么想的。但继续往下看数据后发现，有些低价平台虽然便宜，但稳定性只有 60%~70%。

有些甚至更低，请求失败以后，程序会自动重试。，重试一次；就意味着同样的问题要重新消耗一次 Token。

如果一天调用量很大，最后省下来的单价优势；可能被重试成本吃掉不少。所以很多团队真正算账的时候。已经不只是看单价了。而是在看：

稳定性
响应速度
成功率

以及最终的真实成本。

缓存能力对成本影响比想象中大

后来我又发现了一个很多人容易忽略的东西。

缓存价格。

一开始我甚至没太关注这一栏，后来仔细看数据的时候。

我人都傻了。

同样是 Claude Opus 4.8。

平台1缓存价格：

¥0.08 / 百万 Token

平台24缓存价格：

¥33.8 / 百万 Token

差了超过 400 倍。

如果你的业务经常使用：

固定提示词
固定系统角色
相似上下文

缓存命中率会非常高。

这个时候。

真正决定成本的可能不是输入价格。

而是缓存价格。

很多人盯着输入价格看半天。

最后却忽略了最影响成本的地方。

不同平台的真实成本其实不一样

后来我尝试换了一个思路。

不看单价。

只看最终账单。

假设两家公司。

每个月都调用 1 亿 Token。

表面上看。

平台A比平台B便宜很多。

但如果：

平台A稳定性低
平台A重试率高
平台A缓存能力差

最终实际花费可能反而更高。

这也是为什么后来我发现。

大家讨论模型的时候。

聊的已经不是：

哪个模型最强。

而是：

哪个平台最适合自己的场景。

因为影响成本的因素。

远远不只是价格表上的那个数字。

查到第20个网页的时候。

后来我决定把这些东西整理到一起

我想解决的不是：

推荐大家用哪个模型。

而是把选模型之前最容易被忽略的信息整理清楚。

比如：

价格到底差多少
缓存成本怎么算
平台稳定性怎么样
同样调用量下真实成本是多少

说白了。

就是让大家少一点信息差。

少一点重复踩坑。

我们目前在整理什么

我们现在主要整理五类信息：

模型价格、缓存价格、供应商来源、稳定性数据，以及不同场景下的使用成本。

说白了，不是想告诉大家“哪个模型最好”。

而是想让大家在选模型之前，先把价格、稳定性和真实成本看明白。

做这个过程中的最大收获

做完这轮整理后，我最大的感受是：

模型选型不能只看排行榜。

真正落到使用里，影响最大的往往是三件事：

成本、稳定性、适不适合自己的业务场景。

有时候，最贵的不一定最好。

最便宜的，也不一定最省钱。

写在最后

做这件事之前，我一直以为模型选型最重要的是能力。

做完以后才发现。

很多团队真正头疼的其实是信息差。

价格在哪里看。

缓存怎么算。

平台稳不稳。

同一个模型为什么差这么多。

这些问题远比排行榜更实际。

如果重新来一次。

我大概率不会再打开那二十多个网站。

但如果没经历过这次折腾。

可能也不会发现这些问题。

后来我把整理的数据做成了一个公开页面。

至少下次再查价格的时候。

不用再一个网页一个网页翻了。

Oken.ai

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

写了 10 个 Agent 后，我才搞懂“什么不是 Agent“

文章摘要（150字）：本文探讨了AI Agent开发的三个常见误区：1)认为能调用工具就是Agent（实则需感知-决策-执行闭环）；2)高估模型能力边界（需区分模型能力与工程兜底）；3)盲目采用多Agent架构（可能增加复杂度）。通过决策循环图解析Agent各层级的工程边界，强调模型是引擎而系统设计（Harness）才是核心竞争力。文章指出，真正的Agent需要实现自主闭环，而非简单叠加功能，并