事情是怎么开始的

一个很普通的问题

最近Claude官方不是发布了claude-opus-4.8嘛,我就想着去查一下价格,我打开官网---看价格--结束。价格确实很美丽,但是我的钱包很差劲,思来想去我便开始走上了“不归路”。

于是我开始在浏览器里面一个个搜:

  • Claude

  • Azure

  • Anthropic

  • 各种聚合平台

  • 各种 API 中转站

  • .....

打开第20个网页的时候

我开始怀疑人生了,开始不相信我的眼睛,开始几个网页来回跳转对不,明明是同一个模型,不同的平台

为什么价格完全不一样?

我发现了一个离谱现象

同一个claude-opus-4.8 ,价格差几十倍

平台 输入价(M) 输出价(M) 缓存价(M)
平台1 ¥0.80 ¥4 ¥0.08
平台2 ¥1 ¥5 ¥0.10
平台3 ¥1 ¥5 ¥0.10
平台4 ¥1.50 ¥7.50 ¥0.15
平台5 ¥2.25 ¥11.25 ¥0.23
平台6 ¥2.50 ¥12.50
平台7 ¥2.50 ¥12.50 ¥0.25
平台8 ¥3 ¥15 ¥0.30
平台9 ¥3 ¥15 ¥0.30
平台10 ¥3.18 ¥15.90 ¥0.32
平台11 ¥3.90 ¥19.50 ¥0.39
平台12 ¥4 ¥20 ¥0.40
平台13 ¥4.08 ¥20.40 ¥0.41
平台14 ¥4.80 ¥24 ¥0.48
平台15 ¥4.80 ¥24 ¥0.48
平台16 ¥4.80 ¥24 ¥0.48
平台17 ¥5 ¥25
平台18 ¥5 ¥25 ¥0.50
平台19 ¥5.40 ¥27 ¥0.54
平台20 ¥8 ¥40 ¥0.80
平台21 ¥15.75 ¥78.75 ¥1.57
平台22 ¥20.75 ¥103.75 ¥2.08
平台23 ¥25 ¥125 ¥2.50
平台24(官网) ¥33.85 ¥169.24 ¥33.80

最低的输入价是0.8,最高的是官网33.85,其他的基本上都在1-8之间,只有少数几家是在15-25,就一个模型就有这么多不同的价格

一开始我以为有人标错了

来来回回看了好几遍,才发现原来

问题出在:

  • 来源不同:我表格中记录的这些有官网和中转,还有三方聚合的

  • 线路不同:线路我没有写出来,但是大概有20多条线路

  • 计费方式不同:有些平台有起充门槛,价格就相对便宜点,但是如果是第一次接触到这个平台,很少有人一上来就充个大几十或者是大几百的,基本上都是要充小部分试一下的,有些平台起充就是1元,但是模型的价格相对会贵一点

价格背后到底差在哪

我把我看过的网页做了一下简单的分类,主要有以下4类:

1.官方

  • 最容易理解,简单来讲就是直接向模型厂商购买,比如 国外的OpenAI、Anthropic ,国内的deepseek

  • 特点

来源最明确

稳定性通常最好

文档最完善

价格一般也是最高

售后也更有保障

  • 适合

企业客户

对稳定性要求高的团队

2.云服务商

  • 云厂商把模型接进自己的平台,例如 国外Azure、AWS、Google Cloud ,国内阿里云,火山云等

  • 特点

统一管理方便

可以和现有云服务一起使用

企业采购流程比较成熟

  • 适合:

已经在使用云服务的团队

3.聚合平台

  • 把多个模型厂商的能力聚合到一个平台,一个账号就能调用多个模型。比如硅基流动

  • 特点

接入方便

支持模型多

不需要分别注册多个账号

价格通常介于官方和中转之间

  • 适合:

开发者

创业团队

需要频繁切换模型的人

4.中转服务

  • 通过兼容接口、转发线路或二次封装的方式提供模型能力,也是目前市场上价格差异最大的部分。

  • 特点

价格跨度非常大

有的比官网便宜很多

有的甚至比官网更贵

稳定性差异也比较明显

  • 适合:

对成本比较敏感的用户

个人创业者

于是我开始整理数据

最开始我只是想简单的记录一下,主要是为了方便自己查询

就只记录:

  • 模型

  • 输入价格

  • 输出价格

  • 缓存价格

  • 平台

可是到后面越整理越多,从几个模型,变成几十个模型,从几个平台变成几十个平台。直到有一次和朋友聊天才知道原来很多人都在重复做同样的事情。

每次选模型:

查价格。

查平台。

查稳定性。

查支持情况。

大家都在重复劳动,每次也都要来来回回去对比。

比价格更有意思的发现

最便宜的不一定最省钱

其实一开始我最关注的是输入价格,谁便宜就排前面,后来发现事情没这么简单。

举个例子,我统计的 24 个平台里。平台1的输入价格只有:¥0.8 / 百万 Token而平台24的价格是:

¥33.85 / 百万 Token两者相差超过 42 倍。看到这里很多人第一反应都是:

那肯定选平台1

我一开始也是这么想的。但继续往下看数据后发现,有些低价平台虽然便宜,但稳定性只有 60%~70%。

有些甚至更低,请求失败以后,程序会自动重试。,重试一次;就意味着同样的问题要重新消耗一次 Token。

如果一天调用量很大,最后省下来的单价优势;可能被重试成本吃掉不少。所以很多团队真正算账的时候。已经不只是看单价了。而是在看:

  • 稳定性

  • 响应速度

  • 成功率

以及最终的真实成本。

缓存能力对成本影响比想象中大

后来我又发现了一个很多人容易忽略的东西。

缓存价格。

一开始我甚至没太关注这一栏,后来仔细看数据的时候。

我人都傻了。

同样是 Claude Opus 4.8。

平台1缓存价格:

¥0.08 / 百万 Token

平台24缓存价格:

¥33.8 / 百万 Token

差了超过 400 倍。

如果你的业务经常使用:

  • 固定提示词

  • 固定系统角色

  • 相似上下文

缓存命中率会非常高。

这个时候。

真正决定成本的可能不是输入价格。

而是缓存价格。

很多人盯着输入价格看半天。

最后却忽略了最影响成本的地方。

不同平台的真实成本其实不一样

后来我尝试换了一个思路。

不看单价。

只看最终账单。

假设两家公司。

每个月都调用 1 亿 Token。

表面上看。

平台A比平台B便宜很多。

但如果:

  • 平台A稳定性低

  • 平台A重试率高

  • 平台A缓存能力差

最终实际花费可能反而更高。

这也是为什么后来我发现。

大家讨论模型的时候。

聊的已经不是:

哪个模型最强。

而是:

哪个平台最适合自己的场景。

因为影响成本的因素。

远远不只是价格表上的那个数字。

查到第20个网页的时候。

后来我决定把这些东西整理到一起

我想解决的不是:

推荐大家用哪个模型。

而是把选模型之前最容易被忽略的信息整理清楚。

比如:

  • 价格到底差多少

  • 缓存成本怎么算

  • 平台稳定性怎么样

  • 同样调用量下真实成本是多少

说白了。

就是让大家少一点信息差。

少一点重复踩坑。

我们目前在整理什么

我们现在主要整理五类信息:

模型价格、缓存价格、供应商来源、稳定性数据,以及不同场景下的使用成本。

说白了,不是想告诉大家“哪个模型最好”。

而是想让大家在选模型之前,先把价格、稳定性和真实成本看明白。

做这个过程中的最大收获

做完这轮整理后,我最大的感受是:

模型选型不能只看排行榜。

真正落到使用里,影响最大的往往是三件事:

成本、稳定性、适不适合自己的业务场景。

有时候,最贵的不一定最好。

最便宜的,也不一定最省钱。

写在最后

做这件事之前,我一直以为模型选型最重要的是能力。

做完以后才发现。

很多团队真正头疼的其实是信息差。

价格在哪里看。

缓存怎么算。

平台稳不稳。

同一个模型为什么差这么多。

这些问题远比排行榜更实际。

如果重新来一次。

我大概率不会再打开那二十多个网站。

但如果没经历过这次折腾。

可能也不会发现这些问题。

后来我把整理的数据做成了一个公开页面。

至少下次再查价格的时候。

不用再一个网页一个网页翻了。

Oken.ai

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐