Anthropic发布Memory API

Anthropic 为其 Claude 开发者平台引入了 上下文编辑（context editing） 和 记忆工具（memory tool），旨在与 Claude Sonnet 4.5 模型协同工作。这些功能解决了固定上下文窗口的局限性，使开发者能够构建更强大的 AI 代理，以处理复杂的长期任务，同时避免信息丢失。通过自动管理上下文和外部存储信息，这些工具显著提升了代理在编码和研究等任务中的性能与效率。

核心问题：上下文窗口有限，但实际工作没有边界

当 AI 代理处理复杂任务时，它们会产生大量的工具调用结果和对话记录。这很快会耗尽模型的“上下文窗口”（即短期记忆）。开发者不得不面临一个艰难选择：要么删减对话记录，要么接受性能下降。

上下文窗口是有限的，但现实世界的工作并非如此。

两大解决方案：上下文编辑与记忆工具

为了解决这个问题，Anthropic 推出了两项新功能，确保只有相关数据保留在上下文中，而有价值的信息则可以跨会话保存。

1. 上下文编辑 (Context Editing)

这项功能可以在上下文窗口接近上限时，自动清除过时的工具调用和结果。它在保留核心对话流程的同时，移除了不再需要的内容。

效果: 极大地延长了代理可以自主运行的时间。
优势: 提升了模型性能，因为它只需关注最相关的信息。

2. 记忆工具 (Memory Tool)

该工具允许 Claude 通过一个基于文件的系统，在上下文窗口之外存储和查询信息。代理可以在一个专用的、持久化的目录中创建、读取、更新和删除文件。

运作方式: 完全通过工具调用在客户端操作，开发者可以完全控制数据的存储位置和方式。
功能: 代理可以逐步建立知识库，跨会话维护项目状态，并参考过去的学习成果。

Claude Sonnet 4.5 模型通过内置的上下文感知能力，能够跟踪可用空间并更有效地管理上下文，从而增强了这两项功能。

显著的性能提升

这些更新共同构成了一个能显著提升代理性能的系统：

通过自动移除过时内容，实现更长时间的对话。
通过将关键信息存入记忆，提高准确性，并让学习成果在不同会话间传递。

实际应用场景

这些功能为需要长时间运行的代理开辟了新的可能性，例如处理整个代码库或分析数百份文档。

编码: 代理可以清除旧的测试结果，同时将调试见解和架构决策保存在记忆中，从而在大型代码库上持续工作。
研究: 代理将关键发现存入记忆，同时清除过时的搜索结果，逐步建立起能提升未来表现的知识库。
数据处理: 代理将中间结果存储在记忆中，同时清除原始数据，从而处理那些原本会超出上下文限制的工作流程。

数据证明效果

在一项内部评估中，新功能带来了显著的性能增益：

上下文编辑单独使用，使代理在复杂任务上的性能提升了 29%。
上下文编辑与记忆工具结合，性能提升了 39%。
在一个包含 100 轮网络搜索的测试中，上下文编辑不仅让代理完成了原本会失败的任务，还将 Token 消耗降低了 84%。

开始使用

这些功能目前已在 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上以公开测试版的形式提供。