Synth Daily

Anthropic发布Memory API

Anthropic 为其 Claude 开发者平台引入了 上下文编辑(context editing)记忆工具(memory tool),旨在与 Claude Sonnet 4.5 模型协同工作。这些功能解决了固定上下文窗口的局限性,使开发者能够构建更强大的 AI 代理,以处理复杂的长期任务,同时避免信息丢失。通过自动管理上下文和外部存储信息,这些工具显著提升了代理在编码和研究等任务中的性能与效率。

核心问题:上下文窗口有限,但实际工作没有边界

当 AI 代理处理复杂任务时,它们会产生大量的工具调用结果和对话记录。这很快会耗尽模型的“上下文窗口”(即短期记忆)。开发者不得不面临一个艰难选择:要么删减对话记录,要么接受性能下降。

上下文窗口是有限的,但现实世界的工作并非如此。

两大解决方案:上下文编辑与记忆工具

为了解决这个问题,Anthropic 推出了两项新功能,确保只有相关数据保留在上下文中,而有价值的信息则可以跨会话保存。

1. 上下文编辑 (Context Editing)

这项功能可以在上下文窗口接近上限时,自动清除过时的工具调用和结果。它在保留核心对话流程的同时,移除了不再需要的内容。

  • 效果: 极大地延长了代理可以自主运行的时间。
  • 优势: 提升了模型性能,因为它只需关注最相关的信息。

2. 记忆工具 (Memory Tool)

该工具允许 Claude 通过一个基于文件的系统,在上下文窗口之外存储和查询信息。代理可以在一个专用的、持久化的目录中创建、读取、更新和删除文件。

  • 运作方式: 完全通过工具调用在客户端操作,开发者可以完全控制数据的存储位置和方式。
  • 功能: 代理可以逐步建立知识库,跨会话维护项目状态,并参考过去的学习成果。

Claude Sonnet 4.5 模型通过内置的上下文感知能力,能够跟踪可用空间并更有效地管理上下文,从而增强了这两项功能。

显著的性能提升

这些更新共同构成了一个能显著提升代理性能的系统:

  • 通过自动移除过时内容,实现更长时间的对话
  • 通过将关键信息存入记忆,提高准确性,并让学习成果在不同会话间传递。

实际应用场景

这些功能为需要长时间运行的代理开辟了新的可能性,例如处理整个代码库或分析数百份文档。

  • 编码: 代理可以清除旧的测试结果,同时将调试见解和架构决策保存在记忆中,从而在大型代码库上持续工作。
  • 研究: 代理将关键发现存入记忆,同时清除过时的搜索结果,逐步建立起能提升未来表现的知识库。
  • 数据处理: 代理将中间结果存储在记忆中,同时清除原始数据,从而处理那些原本会超出上下文限制的工作流程。

数据证明效果

在一项内部评估中,新功能带来了显著的性能增益:

  • 上下文编辑单独使用,使代理在复杂任务上的性能提升了 29%
  • 上下文编辑与记忆工具结合,性能提升了 39%
  • 在一个包含 100 轮网络搜索的测试中,上下文编辑不仅让代理完成了原本会失败的任务,还将 Token 消耗降低了 84%

开始使用

这些功能目前已在 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上以公开测试版的形式提供。