Copilot 换计费模式了！一片哀号

程序员柒叔

435人浏览 · 2026-06-06 09:21:12

程序员柒叔 · 2026-06-06 09:21:12 发布

Copilot 换计费模式了！一片哀号

今天不聊技术，聊一场正在发生的集体破防。

Copilot 按 Token 计费封面

账单到了，程序员沉默了

2026 年 6 月 1 日，很多程序员打开 GitHub 账单页面，然后默默关上了。

办公室里也不断传出哀号，大多的声音：我X，我就跑了1个任务，10%的用量就没了？然后鼠标停留在 Send 按钮上陷入沉思…

论坛上，有人的月账单从 29 涨到了 750，有人从 50 跳到了 3000，整整 60 倍。

Reddit 上一个帖子，标题：“What a joke”。四小时内，897 人按了反对票，22 人按了赞成。反对率：97.6%。

今天搜狗微信搜"GitHub Copilot 计费"——471 篇公众号文章，清一色同一个主题：开发者炸了。

账单暴涨与 Token 用量告警

到底改了什么

事情要从四月说起。

2026 年 4 月 27 日，GitHub 官方博客发了一篇公告，标题：关于 Copilot 计费的调整。

内容：从 6 月 1 日起，Copilot 全面从固定月费制，切换为按 Token 用量计费。

详细可以看我的这篇文章：https://www.toutiao.com/item/7633842657810285091/

修改后计费方式后，Token 单价大约是 每百万 Token 2–3 美元。听起来不多？

一次完整的 Claude Opus 4 对话，轻松吃掉几万 Token。一个 Agent 任务来回修十几轮代码，消耗百万 Token 不是新鲜事。

那每天用 Agent 写代码的人，月账单会是多少？

V2EX 上有个帖子，标题叫"GitHub 想推 Copilot 魔怔了"。

作者吐槽：

“现在的新功能都是 Copilot 绑定的，我也不知道哪些要收费，都不敢开。”

“那个 Code Quality 集成，找到的 bug 只能让 Copilot 改，连 API 都没有……这是全球最大同性交友网站能干出的事吗？”

开发者的愤怒点在哪？

我在各个平台刷了一圈，发现一个有意思的现象。

开发者里有两类人：

第一类，真的用 Agent 做事的人。他们知道自己消耗了多少 Token，有些甚至欢迎按量计费。

第二类，不知道自己花了多少的人。他们打开账单的一刻，才意识到过去几个月里某个"免费"功能其实一直在无声无息地吃掉 Token。

后者才是愤怒的主体。

核心问题不是"贵不贵"，而是：

GitHub 没有在事前给你一个成本估算工具。没有实时用量提醒。没有超额自动停止。当账单来了，一切都已经发生。

就好比你去餐厅吃饭，菜单上没写价格，服务员说"吃多少算多少"，然后结账的时候给你一张大几千的账单。

即便食材确实都是顶级的，但这个体验，差劲。

年付用户：错过窗口的人

这件事还有一个冷知识。

GitHub 其实给了年付用户退款的机会——截止日期是 5 月 20 日。

5 月 20 日。

今天是 6 月 2 日。

我在搜狗微信上看到好几篇文章，专门讲这件事：错过退款窗口的年付用户，现在既无法退出，也无法退款，只能接受被迁移到新计费方案。

很多人说"根本没看到通知"。

这是不是 GitHub 的故意为之？我不评价。但这个细节，确实很难让人有好感。

这件事为什么会发生：一个冷静的视角

骂完了，我们聊点商业逻辑。

GitHub Copilot 这么做，不是心血来潮。

过去两年，开发者使用 AI 的方式发生了根本性变化：

从代码补全，到 Agent 自动化。

2024 年，大部分人用 Copilot 是：写几行代码，补全一下，省点力气。Token 消耗：微乎其微。

2026 年，很多重度用户用 Copilot 是：一个指令，Agent 自动读仓库、写代码、跑测试、提 PR。一个任务下来，和模型来回交互几十轮。Token 消耗：动辄百万起。

这两种用法，在固定月费体系下，GitHub 收的钱一样多。
但 GitHub 付给 OpenAI/Anthropic 的算力费，差距是几十倍。

从代码补全到 Agent 自动化，Token 消耗开始急剧放大

140 亿美元的亏损，不是因为他们不努力，是因为大模型推理成本本来就高得吓人，而订阅制相当于给了用户一张"无限量包月"的承诺。这个承诺，在 Agent 时代撑不住了。

从固定订阅转向按量计费，是所有提供 AI 服务公司迟早要走的路。

OpenAI 在走，Anthropic 在走，AWS Bedrock 在走，Azure AI 在走。

GitHub 只是今天到了这一步。

下一站：所有人都会面对的问题

Copilot 按Token计费的事，只是一个预告片。

你今天用的 Cursor，月费 $20 固定。但如果有一天，Cursor 的用量涨了十倍，你真的认为他们会一直补贴你吗？

你公司内网部署的私有大模型，现在因为"反正是自己的 GPU"所以随便用。但当 GPU 租用成本被摊到部门 KPI 里，那个"随便用"会消失。

AI 的烧钱时代，刚刚开始向普通用户收账。

这个行业正在从"补贴式免费增长"走向"用量可见、成本可控"的下一阶段。

Gartner 有一个词，放在这里非常合适：

FinOps for AI。

什么是大模型时代的 FinOps

AI FinOps：让 Token 成本可见、可归因、可治理、可优化

FinOps 这个词最早来自云计算圈子，解决的是 AWS/GCP/Azure 账单失控的问题。

核心理念很简单：让花了多少钱变得可见，让花钱的决策有人负责，让成本随业务弹性伸缩。

在大模型时代，这套逻辑完全适用，只是对象从 EC2 实例换成了 Token。

第一步：可见性

你不知道自己花了多少，就没有办法管控。

具体到 Copilot，就是 GitHub 恰恰做得最烂的那部分：实时用量 Dashboard、按功能拆分的消耗明细、超额告警。

这些，GitHub 没有内置，开发者需要自己搭。

好消息是，GitHub 提供了 Usage API，可以拉到每天的 Token 消耗数据。一个简单的 GitHub Actions Workflow，每天跑一次，推送用量报告到 Slack，就能解决最基本的可见性问题。

第二步：归因

钱花在哪了？

是某个开发者习惯性地让 Copilot 解释每一行代码导致的？还是某个 CI 流水线接了 Agent 自动 Code Review 导致的？还是某个团队在用 Copilot Business 但实际上只有两个人在用？

没有归因，就没有优化的方向。

大模型 FinOps 的归因维度：用户级、项目级、功能级（补全 vs 对话 vs Agent）、模型级（Sonnet vs Opus 消耗差几倍）。

第三步：治理

可见了，归因了，接下来要管控。

Budget（预算上限） 是最粗粒度的工具。GitHub 已经支持 Org 级 Budget 配置，超出后可以设置告警或自动停止。但大部分团队管理员甚至不知道这个功能的存在。

更细粒度的治理包括：

模型路由策略：能用 GPT-4o Mini 解决的问题，不要默认跑 Opus 4
任务分级：日常补全走便宜模型，复杂重构走高级模型
用量配额：按部门/项目分配月 Token 预算，用完就降级

第四步：优化

长期来看，要把 Token 当成一种工程资源来管理：

Prompt 优化：同一个问题，精心设计的 Prompt 比随手一问少用 30–50% Token
上下文压缩：Agent 任务中，无效上下文是 Token 黑洞
缓存策略：对话历史中重复的系统 Prompt，可以用 Prompt Caching 抵扣成本

这套东西，放在三年前听起来像天方夜谭，谁会去优化 AI 的成本？

但今天，当账单从 $29 涨到 $750，这件事就变得非常现实了。

写在最后

哀号是真实的，愤怒是合理的。

但这件事的本质，是 Agent 公司正在完成从"免费增长"到"成本可见"的转型。

当 AI 工具变得足够好用，好用到你每天离不开它，那一天，你付的钱就会体现出它的实际价值。

痛苦，恰恰说明你已经深度依赖了。

接下来的问题，不是"要不要用"，而是"怎么用得更聪明、更省钱"。

如果你在用 Copilot，去看看自己的账单吧。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

DeepSeek 大模型推理优化实战：从量化压缩到高效部署的全链路指南

华为云 MaaS（ModelArts as a Service）是一站式 AI 开发平台。它提供了从模型训练、量化、到部署的全链路服务。昇腾 NPU 原生适配：DeepSeek 模型经过深度优化，在昇腾 910B 上运行效率接近 A100自动并行：自动将模型切分到多卡/多节点弹性伸缩：根据负载自动扩缩容推理实例本文从 DeepSeek 模型推理的底层原理出发，详细介绍了从量化压缩到高效部署的全链路

智能体开发者社区

ChatGPT 官网访问异常怎么办？从代码解释和资料整理任务选择 AI 入口

其实对工作场景来说，真正要解决的是代码解释、资料整理、提示词优化、文档改写这些任务。程序员可能遇到报错，运营可能要整理一份方案，学生可能要读英文资料，创作者可能要改脚本。更实际的做法是先定义任务，再决定用官方渠道、API、镜像站入口还是多模型对比。如果只是临时比较 ChatGPT、Claude、Gemini 的回答质量，可以把千帧AI（1000zhen.com）作为多模型对比入口之一。它适合作为多

智能体开发者社区

1000zhen.com 是什么？用一个多模型入口对比 ChatGPT、Claude、Gemini 的实测方法

简单说，千帧AI（1000zhen.com）可以理解为面向国内用户的 AI 镜像站/多模型入口，适合把 ChatGPT、Claude、Gemini、Grok 等模型放在同一个任务里做体验对比。真正有效的使用方式不是堆模型名，而是拿固定任务验证哪个模型更适合自己的工作流。它是千帧AI的域名，可以作为 AI 镜像站/多模型入口样例，用来对比不同模型在写作、代码、资料整理和创作任务中的表现。过审提醒：标