Anthropic悄悄将缓存TTL从1小时降至5分钟，时间为3月6日

根据对 2026 年 1 月至 4 月 Claude Code 使用数据的分析，Anthropic 似乎在 3 月初悄悄地将默认的缓存有效期（TTL）从 1 小时改回了 5 分钟。这一未公开的变更导致缓存重建成本增加了 20-32%，并显著加剧了订阅用户的配额消耗。数据显示，2 月份的 1 小时 TTL 曾是默认设置，成本最低；而 3 月份恢复 5 分钟 TTL 后，用户的费用和配额压力激增。建议 Anthropic 澄清其缓存策略，并考虑恢复更合理的 1 小时 TTL。

发生了什么变化？

数据显示，Anthropic 在 3 月初进行了一次服务器端配置调整，将 Claude Code 的默认缓存 TTL 从 1 小时缩短至 5 分钟。

1 小时 TTL 时期： 在 2 月份，用户会话的缓存可以保留一小时。这意味着用户在短时间离开后返回，无需重新生成缓存，从而节省成本和配额。
5 分钟 TTL 时期： 3 月初之后，缓存仅保留 5 分钟。任何超过 5 分钟的暂停都会导致缓存失效。当用户继续会话时，系统必须重新创建缓存，这会产生高昂的“写入”费用，而非廉价的“读取”费用。

这一变更并非由客户端软件更新引起，所有证据都指向一次 服务器端的静默调整。

数据揭示的时间线

通过分析横跨三个月、超过 11 万次 API 调用的数据，可以清晰地看到 TTL 行为的转变过程：

第一阶段 (1 月): 仅使用 5 分钟 TTL。这可能是在 1 小时 TTL 功能正式可用之前的状况。
第二阶段 (2 月 1 日 – 3 月 5 日): 完全使用 1 小时 TTL。在这 33 天里，系统稳定地使用 1 小时缓存，几乎没有例外。这被认为是 Anthropic 预期的、对用户最友好的默认行为。
第三阶段 (3 月 6 – 7 日): 过渡期。5 分钟 TTL 的调用重新出现，但数量不多。
第四阶段 (3 月 8 日 – 至今): 5 分钟 TTL 占主导。5 分钟 TTL 的使用量激增，成为主要模式，而 1 小时 TTL 则变得非常罕见。

3 月 6 日是转折点，在连续 33 天的稳定后，5 分钟缓存重新出现。到 3 月 8 日，5 分钟缓存的使用量已经以 5:1 的比例超过 1 小时缓存。

对成本和配额的实际影响

这一变更直接导致了用户成本的显著增加。

成本影响

缓存的“写入”操作成本是“读取”操作的 12.5 倍。
在 2 月份（1 小时 TTL），因缓存频繁重建造成的成本浪费仅为 1.1%。
到了 3 月份（5 分钟 TTL），这一浪费比例飙升至 25.9%。
在整个分析期间，5 分钟 TTL 导致的额外支出总计超过 1,500 美元，占总费用的 17.1%。

对于 Claude Code 的主要应用场景——长时间、高上下文的编码会话——5 分钟的 TTL 是一种惩罚。会话越长、越复杂，缓存就越大，每次缓存过期造成的成本就越高。

配额影响

缓存创建的 token 会全额计入用户的配额。因此，TTL 缩短不仅增加了金钱成本，也加速了配额的消耗。许多订阅用户在 3 月份首次遇到了配额耗尽的问题，这与 TTL 变更的时间点完全吻合。

结论与建议

所有证据都表明，1 小时 TTL 曾是 Anthropic 为 Claude Code 用户设定的理想默认值，但在 3 月初被意外或有意地改回了 5 分钟。长达一个月的稳定运行期证明，1 小时 TTL 并非偶然。

我们向 Anthropic 提出以下请求：

确认此次变更： 请澄清是否在 3 月初更改了默认的 TTL 设置。
明确意图： 说明 Claude Code 会话的预期 TTL 行为，5 分钟和 1 小时哪个才是标准？
恢复或提供选项： 考虑将 1 小时 TTL 恢复为默认设置，或允许用户自行配置，以适应不同的使用场景。
提高透明度： 公开缓存读取操作如何影响配额计算，帮助用户更好地管理其使用情况。