Copilot 换计费模式了!一片哀号

今天不聊技术,聊一场正在发生的集体破防。

Copilot 按 Token 计费封面

账单到了,程序员沉默了

2026 年 6 月 1 日,很多程序员打开 GitHub 账单页面,然后默默关上了。

办公室里也不断传出哀号,大多的声音:我X,我就跑了1个任务,10%的用量就没了?然后鼠标停留在 Send 按钮上陷入沉思…

论坛上,有人的月账单从 29 涨到了 750,有人从 50 跳到了 3000,整整 60 倍

Reddit 上一个帖子,标题:“What a joke”。四小时内,897 人按了反对票,22 人按了赞成。反对率:97.6%。

今天搜狗微信搜"GitHub Copilot 计费"——471 篇公众号文章,清一色同一个主题:开发者炸了。

账单暴涨与 Token 用量告警


到底改了什么

事情要从四月说起。

2026 年 4 月 27 日,GitHub 官方博客发了一篇公告,标题:关于 Copilot 计费的调整。

内容:从 6 月 1 日起,Copilot 全面从固定月费制,切换为按 Token 用量计费

详细可以看我的这篇文章:https://www.toutiao.com/item/7633842657810285091/

修改后计费方式后,Token 单价大约是 每百万 Token 2–3 美元。听起来不多?

一次完整的 Claude Opus 4 对话,轻松吃掉几万 Token。一个 Agent 任务来回修十几轮代码,消耗百万 Token 不是新鲜事。

那每天用 Agent 写代码的人,月账单会是多少?

V2EX 上有个帖子,标题叫"GitHub 想推 Copilot 魔怔了"。

作者吐槽:

“现在的新功能都是 Copilot 绑定的,我也不知道哪些要收费,都不敢开。”

“那个 Code Quality 集成,找到的 bug 只能让 Copilot 改,连 API 都没有……这是全球最大同性交友网站能干出的事吗?”


开发者的愤怒点在哪?

我在各个平台刷了一圈,发现一个有意思的现象。

开发者里有两类人:

第一类,真的用 Agent 做事的人。他们知道自己消耗了多少 Token,有些甚至欢迎按量计费。

第二类,不知道自己花了多少的人。他们打开账单的一刻,才意识到过去几个月里某个"免费"功能其实一直在无声无息地吃掉 Token。

后者才是愤怒的主体。

核心问题不是"贵不贵",而是:

GitHub 没有在事前给你一个成本估算工具。没有实时用量提醒。没有超额自动停止。当账单来了,一切都已经发生。

就好比你去餐厅吃饭,菜单上没写价格,服务员说"吃多少算多少",然后结账的时候给你一张大几千的账单。

即便食材确实都是顶级的,但这个体验,差劲。


年付用户:错过窗口的人

这件事还有一个冷知识。

GitHub 其实给了年付用户退款的机会——截止日期是 5 月 20 日

5 月 20 日。

今天是 6 月 2 日。

我在搜狗微信上看到好几篇文章,专门讲这件事:错过退款窗口的年付用户,现在既无法退出,也无法退款,只能接受被迁移到新计费方案。

很多人说"根本没看到通知"。

这是不是 GitHub 的故意为之?我不评价。但这个细节,确实很难让人有好感。


这件事为什么会发生:一个冷静的视角

骂完了,我们聊点商业逻辑。

GitHub Copilot 这么做,不是心血来潮。

过去两年,开发者使用 AI 的方式发生了根本性变化:

从代码补全,到 Agent 自动化。

2024 年,大部分人用 Copilot 是:写几行代码,补全一下,省点力气。Token 消耗:微乎其微。

2026 年,很多重度用户用 Copilot 是:一个指令,Agent 自动读仓库、写代码、跑测试、提 PR。一个任务下来,和模型来回交互几十轮。Token 消耗:动辄百万起。

这两种用法,在固定月费体系下,GitHub 收的钱一样多。
但 GitHub 付给 OpenAI/Anthropic 的算力费,差距是几十倍。

从代码补全到 Agent 自动化,Token 消耗开始急剧放大

140 亿美元的亏损,不是因为他们不努力,是因为大模型推理成本本来就高得吓人,而订阅制相当于给了用户一张"无限量包月"的承诺。这个承诺,在 Agent 时代撑不住了。

从固定订阅转向按量计费,是所有提供 AI 服务公司迟早要走的路。

OpenAI 在走,Anthropic 在走,AWS Bedrock 在走,Azure AI 在走。

GitHub 只是今天到了这一步。


下一站:所有人都会面对的问题

Copilot 按Token计费的事,只是一个预告片。

你今天用的 Cursor,月费 $20 固定。但如果有一天,Cursor 的用量涨了十倍,你真的认为他们会一直补贴你吗?

你公司内网部署的私有大模型,现在因为"反正是自己的 GPU"所以随便用。但当 GPU 租用成本被摊到部门 KPI 里,那个"随便用"会消失。

AI 的烧钱时代,刚刚开始向普通用户收账。

这个行业正在从"补贴式免费增长"走向"用量可见、成本可控"的下一阶段。

Gartner 有一个词,放在这里非常合适:

FinOps for AI。


什么是大模型时代的 FinOps

AI FinOps:让 Token 成本可见、可归因、可治理、可优化

FinOps 这个词最早来自云计算圈子,解决的是 AWS/GCP/Azure 账单失控的问题。

核心理念很简单:让花了多少钱变得可见,让花钱的决策有人负责,让成本随业务弹性伸缩。

在大模型时代,这套逻辑完全适用,只是对象从 EC2 实例换成了 Token。

第一步:可见性

你不知道自己花了多少,就没有办法管控。

具体到 Copilot,就是 GitHub 恰恰做得最烂的那部分:实时用量 Dashboard、按功能拆分的消耗明细、超额告警

这些,GitHub 没有内置,开发者需要自己搭。

好消息是,GitHub 提供了 Usage API,可以拉到每天的 Token 消耗数据。一个简单的 GitHub Actions Workflow,每天跑一次,推送用量报告到 Slack,就能解决最基本的可见性问题。

第二步:归因

钱花在哪了?

是某个开发者习惯性地让 Copilot 解释每一行代码导致的?还是某个 CI 流水线接了 Agent 自动 Code Review 导致的?还是某个团队在用 Copilot Business 但实际上只有两个人在用?

没有归因,就没有优化的方向。

大模型 FinOps 的归因维度:用户级、项目级、功能级(补全 vs 对话 vs Agent)、模型级(Sonnet vs Opus 消耗差几倍)。

第三步:治理

可见了,归因了,接下来要管控。

Budget(预算上限) 是最粗粒度的工具。GitHub 已经支持 Org 级 Budget 配置,超出后可以设置告警或自动停止。但大部分团队管理员甚至不知道这个功能的存在。

更细粒度的治理包括:

  • 模型路由策略:能用 GPT-4o Mini 解决的问题,不要默认跑 Opus 4
  • 任务分级:日常补全走便宜模型,复杂重构走高级模型
  • 用量配额:按部门/项目分配月 Token 预算,用完就降级

第四步:优化

长期来看,要把 Token 当成一种工程资源来管理:

  • Prompt 优化:同一个问题,精心设计的 Prompt 比随手一问少用 30–50% Token
  • 上下文压缩:Agent 任务中,无效上下文是 Token 黑洞
  • 缓存策略:对话历史中重复的系统 Prompt,可以用 Prompt Caching 抵扣成本

这套东西,放在三年前听起来像天方夜谭,谁会去优化 AI 的成本?

但今天,当账单从 $29 涨到 $750,这件事就变得非常现实了。


写在最后

哀号是真实的,愤怒是合理的。

但这件事的本质,是 Agent 公司正在完成从"免费增长"到"成本可见"的转型。

当 AI 工具变得足够好用,好用到你每天离不开它,那一天,你付的钱就会体现出它的实际价值。

痛苦,恰恰说明你已经深度依赖了。

接下来的问题,不是"要不要用",而是"怎么用得更聪明、更省钱"。


如果你在用 Copilot,去看看自己的账单吧。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐