由于智能代理工作流导致计算资源消耗激增,影响了服务质量,GitHub 决定调整 Copilot 个人计划。主要措施包括暂停新用户注册、收紧现有用户的使用限制,并调整了模型可用性。此举旨在保障现有用户的服务体验,同时鼓励用户根据自身需求选择升级计划或调整使用方式。受影响的用户可以在特定时间内申请退款。
为什么会发生这些变化?
智能代理工作流(Agentic workflows)从根本上改变了 Copilot 的计算需求。长时间、并行的会话消耗的资源远超原有计划的预期。随着代理功能越来越强大,更多用户触及了为维持服务稳定性而设定的使用上限。
这些长时间运行的并行工作流虽然能创造巨大价值,但也对我们的基础设施和定价结构提出了挑战:现在,少数几个请求产生的成本就超过计划价格的情况已屡见不鲜!
如果不采取行动,所有人的服务质量都会下降。这些调整是为了在开发更可持续的解决方案的同时,为现有用户提供稳定可预测的体验。
主要调整内容
为了更有效地服务现有客户,GitHub 正在实施以下几项关键调整:
- 暂停新用户注册: GitHub Copilot Pro、Pro+ 和学生计划将暂停接纳新用户。
- 收紧使用限制: 个人计划的使用限制将变得更严格。需要更高额度的 Pro 用户可以升级到 Pro+ 计划,其限制是 Pro 计划的 5 倍以上。
- 调整模型可用性: Opus 模型不再对 Pro 计划用户开放。Pro+ 计划将保留部分 Opus 模型版本。
Copilot 的使用限制如何运作?
目前存在两种使用限制,它们都取决于 token 消耗量和模型乘数这两个因素。
- 会话限制 (Session limits): 主要用于防止服务在高峰时段过载。如果达到此限制,必须等待当前使用窗口重置后才能继续使用。
- 周度限制 (Weekly limits): 限制用户在 7 天内可以消耗的 token 总量。这是为了控制那些长时间运行、成本极高的并行请求。
重点: 使用限制与您的 高级请求权利 是分开的。即使您还有剩余的高级请求次数,仍有可能触及基于 token 消耗量的使用限制。
如何避免意外触及限制
为了提高透明度并帮助您避免意外中断,VS Code 和 Copilot CLI 现在会在您接近使用限制时显示可用额度。
如果您发现自己接近限制,可以尝试以下方法:
- 选择较小的模型: 对于简单任务,使用模型乘数较小的模型,可以减慢消耗速度。
- 升级计划: 如果您是 Pro 用户,可以考虑升级到 Pro+,将使用限制提高 5 倍以上。
- 使用计划模式: 在 VS Code 和 Copilot CLI 中使用
plan mode可以提高任务效率和成功率。 - 减少并行工作流: 像
/fleet这样的工具会消耗大量 token,在接近限制时应谨慎使用。
如果这些调整不适合您
如果您认为这些变化不符合您的工作需求,可以选择取消 Pro 或 Pro+ 订阅。您可以在 4月20日至5月20日 期间联系 GitHub 客服,申请退还当前订阅期内的剩余费用。