Copilot 换计费模式了!一片哀号
Copilot 换计费模式了!一片哀号
今天不聊技术,聊一场正在发生的集体破防。

账单到了,程序员沉默了
2026 年 6 月 1 日,很多程序员打开 GitHub 账单页面,然后默默关上了。
办公室里也不断传出哀号,大多的声音:我X,我就跑了1个任务,10%的用量就没了?然后鼠标停留在 Send 按钮上陷入沉思…
论坛上,有人的月账单从 29 涨到了 750,有人从 50 跳到了 3000,整整 60 倍。
Reddit 上一个帖子,标题:“What a joke”。四小时内,897 人按了反对票,22 人按了赞成。反对率:97.6%。
今天搜狗微信搜"GitHub Copilot 计费"——471 篇公众号文章,清一色同一个主题:开发者炸了。

到底改了什么
事情要从四月说起。
2026 年 4 月 27 日,GitHub 官方博客发了一篇公告,标题:关于 Copilot 计费的调整。
内容:从 6 月 1 日起,Copilot 全面从固定月费制,切换为按 Token 用量计费。
详细可以看我的这篇文章:https://www.toutiao.com/item/7633842657810285091/
修改后计费方式后,Token 单价大约是 每百万 Token 2–3 美元。听起来不多?
一次完整的 Claude Opus 4 对话,轻松吃掉几万 Token。一个 Agent 任务来回修十几轮代码,消耗百万 Token 不是新鲜事。
那每天用 Agent 写代码的人,月账单会是多少?
V2EX 上有个帖子,标题叫"GitHub 想推 Copilot 魔怔了"。
作者吐槽:
“现在的新功能都是 Copilot 绑定的,我也不知道哪些要收费,都不敢开。”
“那个 Code Quality 集成,找到的 bug 只能让 Copilot 改,连 API 都没有……这是全球最大同性交友网站能干出的事吗?”
开发者的愤怒点在哪?
我在各个平台刷了一圈,发现一个有意思的现象。
开发者里有两类人:
第一类,真的用 Agent 做事的人。他们知道自己消耗了多少 Token,有些甚至欢迎按量计费。
第二类,不知道自己花了多少的人。他们打开账单的一刻,才意识到过去几个月里某个"免费"功能其实一直在无声无息地吃掉 Token。
后者才是愤怒的主体。
核心问题不是"贵不贵",而是:
GitHub 没有在事前给你一个成本估算工具。没有实时用量提醒。没有超额自动停止。当账单来了,一切都已经发生。
就好比你去餐厅吃饭,菜单上没写价格,服务员说"吃多少算多少",然后结账的时候给你一张大几千的账单。
即便食材确实都是顶级的,但这个体验,差劲。
年付用户:错过窗口的人
这件事还有一个冷知识。
GitHub 其实给了年付用户退款的机会——截止日期是 5 月 20 日。
5 月 20 日。
今天是 6 月 2 日。
我在搜狗微信上看到好几篇文章,专门讲这件事:错过退款窗口的年付用户,现在既无法退出,也无法退款,只能接受被迁移到新计费方案。
很多人说"根本没看到通知"。
这是不是 GitHub 的故意为之?我不评价。但这个细节,确实很难让人有好感。
这件事为什么会发生:一个冷静的视角
骂完了,我们聊点商业逻辑。
GitHub Copilot 这么做,不是心血来潮。
过去两年,开发者使用 AI 的方式发生了根本性变化:
从代码补全,到 Agent 自动化。
2024 年,大部分人用 Copilot 是:写几行代码,补全一下,省点力气。Token 消耗:微乎其微。
2026 年,很多重度用户用 Copilot 是:一个指令,Agent 自动读仓库、写代码、跑测试、提 PR。一个任务下来,和模型来回交互几十轮。Token 消耗:动辄百万起。
这两种用法,在固定月费体系下,GitHub 收的钱一样多。
但 GitHub 付给 OpenAI/Anthropic 的算力费,差距是几十倍。

140 亿美元的亏损,不是因为他们不努力,是因为大模型推理成本本来就高得吓人,而订阅制相当于给了用户一张"无限量包月"的承诺。这个承诺,在 Agent 时代撑不住了。
从固定订阅转向按量计费,是所有提供 AI 服务公司迟早要走的路。
OpenAI 在走,Anthropic 在走,AWS Bedrock 在走,Azure AI 在走。
GitHub 只是今天到了这一步。
下一站:所有人都会面对的问题
Copilot 按Token计费的事,只是一个预告片。
你今天用的 Cursor,月费 $20 固定。但如果有一天,Cursor 的用量涨了十倍,你真的认为他们会一直补贴你吗?
你公司内网部署的私有大模型,现在因为"反正是自己的 GPU"所以随便用。但当 GPU 租用成本被摊到部门 KPI 里,那个"随便用"会消失。
AI 的烧钱时代,刚刚开始向普通用户收账。
这个行业正在从"补贴式免费增长"走向"用量可见、成本可控"的下一阶段。
Gartner 有一个词,放在这里非常合适:
FinOps for AI。
什么是大模型时代的 FinOps

FinOps 这个词最早来自云计算圈子,解决的是 AWS/GCP/Azure 账单失控的问题。
核心理念很简单:让花了多少钱变得可见,让花钱的决策有人负责,让成本随业务弹性伸缩。
在大模型时代,这套逻辑完全适用,只是对象从 EC2 实例换成了 Token。
第一步:可见性
你不知道自己花了多少,就没有办法管控。
具体到 Copilot,就是 GitHub 恰恰做得最烂的那部分:实时用量 Dashboard、按功能拆分的消耗明细、超额告警。
这些,GitHub 没有内置,开发者需要自己搭。
好消息是,GitHub 提供了 Usage API,可以拉到每天的 Token 消耗数据。一个简单的 GitHub Actions Workflow,每天跑一次,推送用量报告到 Slack,就能解决最基本的可见性问题。
第二步:归因
钱花在哪了?
是某个开发者习惯性地让 Copilot 解释每一行代码导致的?还是某个 CI 流水线接了 Agent 自动 Code Review 导致的?还是某个团队在用 Copilot Business 但实际上只有两个人在用?
没有归因,就没有优化的方向。
大模型 FinOps 的归因维度:用户级、项目级、功能级(补全 vs 对话 vs Agent)、模型级(Sonnet vs Opus 消耗差几倍)。
第三步:治理
可见了,归因了,接下来要管控。
Budget(预算上限) 是最粗粒度的工具。GitHub 已经支持 Org 级 Budget 配置,超出后可以设置告警或自动停止。但大部分团队管理员甚至不知道这个功能的存在。
更细粒度的治理包括:
- 模型路由策略:能用 GPT-4o Mini 解决的问题,不要默认跑 Opus 4
- 任务分级:日常补全走便宜模型,复杂重构走高级模型
- 用量配额:按部门/项目分配月 Token 预算,用完就降级
第四步:优化
长期来看,要把 Token 当成一种工程资源来管理:
- Prompt 优化:同一个问题,精心设计的 Prompt 比随手一问少用 30–50% Token
- 上下文压缩:Agent 任务中,无效上下文是 Token 黑洞
- 缓存策略:对话历史中重复的系统 Prompt,可以用 Prompt Caching 抵扣成本
这套东西,放在三年前听起来像天方夜谭,谁会去优化 AI 的成本?
但今天,当账单从 $29 涨到 $750,这件事就变得非常现实了。
写在最后
哀号是真实的,愤怒是合理的。
但这件事的本质,是 Agent 公司正在完成从"免费增长"到"成本可见"的转型。
当 AI 工具变得足够好用,好用到你每天离不开它,那一天,你付的钱就会体现出它的实际价值。
痛苦,恰恰说明你已经深度依赖了。
接下来的问题,不是"要不要用",而是"怎么用得更聪明、更省钱"。
如果你在用 Copilot,去看看自己的账单吧。
更多推荐
所有评论(0)