Synth Daily

Anthropic悄悄将缓存TTL从1小时降至5分钟,时间为3月6日

根据对 2026 年 1 月至 4 月 Claude Code 使用数据的分析,Anthropic 似乎在 3 月初悄悄地将默认的缓存有效期(TTL)从 1 小时改回了 5 分钟。这一未公开的变更导致缓存重建成本增加了 20-32%,并显著加剧了订阅用户的配额消耗。数据显示,2 月份的 1 小时 TTL 曾是默认设置,成本最低;而 3 月份恢复 5 分钟 TTL 后,用户的费用和配额压力激增。建议 Anthropic 澄清其缓存策略,并考虑恢复更合理的 1 小时 TTL。

发生了什么变化?

数据显示,Anthropic 在 3 月初进行了一次服务器端配置调整,将 Claude Code 的默认缓存 TTL 从 1 小时缩短至 5 分钟

  • 1 小时 TTL 时期: 在 2 月份,用户会话的缓存可以保留一小时。这意味着用户在短时间离开后返回,无需重新生成缓存,从而节省成本和配额。
  • 5 分钟 TTL 时期: 3 月初之后,缓存仅保留 5 分钟。任何超过 5 分钟的暂停都会导致缓存失效。当用户继续会话时,系统必须重新创建缓存,这会产生高昂的“写入”费用,而非廉价的“读取”费用。

这一变更并非由客户端软件更新引起,所有证据都指向一次 服务器端的静默调整

数据揭示的时间线

通过分析横跨三个月、超过 11 万次 API 调用的数据,可以清晰地看到 TTL 行为的转变过程:

  • 第一阶段 (1 月): 仅使用 5 分钟 TTL。这可能是在 1 小时 TTL 功能正式可用之前的状况。
  • 第二阶段 (2 月 1 日 – 3 月 5 日): 完全使用 1 小时 TTL。在这 33 天里,系统稳定地使用 1 小时缓存,几乎没有例外。这被认为是 Anthropic 预期的、对用户最友好的默认行为
  • 第三阶段 (3 月 6 – 7 日): 过渡期。5 分钟 TTL 的调用重新出现,但数量不多。
  • 第四阶段 (3 月 8 日 – 至今): 5 分钟 TTL 占主导。5 分钟 TTL 的使用量激增,成为主要模式,而 1 小时 TTL 则变得非常罕见。

3 月 6 日是转折点,在连续 33 天的稳定后,5 分钟缓存重新出现。到 3 月 8 日,5 分钟缓存的使用量已经以 5:1 的比例超过 1 小时缓存。

对成本和配额的实际影响

这一变更直接导致了用户成本的显著增加。

成本影响

  • 缓存的“写入”操作成本是“读取”操作的 12.5 倍
  • 在 2 月份(1 小时 TTL),因缓存频繁重建造成的成本浪费仅为 1.1%
  • 到了 3 月份(5 分钟 TTL),这一浪费比例飙升至 25.9%
  • 在整个分析期间,5 分钟 TTL 导致的额外支出总计超过 1,500 美元,占总费用的 17.1%。

对于 Claude Code 的主要应用场景——长时间、高上下文的编码会话——5 分钟的 TTL 是一种惩罚。会话越长、越复杂,缓存就越大,每次缓存过期造成的成本就越高。

配额影响

缓存创建的 token 会全额计入用户的配额。因此,TTL 缩短不仅增加了金钱成本,也加速了配额的消耗。许多订阅用户在 3 月份首次遇到了配额耗尽的问题,这与 TTL 变更的时间点完全吻合。

结论与建议

所有证据都表明,1 小时 TTL 曾是 Anthropic 为 Claude Code 用户设定的理想默认值,但在 3 月初被意外或有意地改回了 5 分钟。长达一个月的稳定运行期证明,1 小时 TTL 并非偶然。

我们向 Anthropic 提出以下请求:

  • 确认此次变更: 请澄清是否在 3 月初更改了默认的 TTL 设置。
  • 明确意图: 说明 Claude Code 会话的预期 TTL 行为,5 分钟和 1 小时哪个才是标准?
  • 恢复或提供选项: 考虑将 1 小时 TTL 恢复为默认设置,或允许用户自行配置,以适应不同的使用场景。
  • 提高透明度: 公开缓存读取操作如何影响配额计算,帮助用户更好地管理其使用情况。