Anthropic 为其 Claude 开发者平台引入了 上下文编辑(context editing) 和 记忆工具(memory tool),旨在与 Claude Sonnet 4.5 模型协同工作。这些功能解决了固定上下文窗口的局限性,使开发者能够构建更强大的 AI 代理,以处理复杂的长期任务,同时避免信息丢失。通过自动管理上下文和外部存储信息,这些工具显著提升了代理在编码和研究等任务中的性能与效率。
核心问题:上下文窗口有限,但实际工作没有边界
当 AI 代理处理复杂任务时,它们会产生大量的工具调用结果和对话记录。这很快会耗尽模型的“上下文窗口”(即短期记忆)。开发者不得不面临一个艰难选择:要么删减对话记录,要么接受性能下降。
上下文窗口是有限的,但现实世界的工作并非如此。
两大解决方案:上下文编辑与记忆工具
为了解决这个问题,Anthropic 推出了两项新功能,确保只有相关数据保留在上下文中,而有价值的信息则可以跨会话保存。
1. 上下文编辑 (Context Editing)
这项功能可以在上下文窗口接近上限时,自动清除过时的工具调用和结果。它在保留核心对话流程的同时,移除了不再需要的内容。
- 效果: 极大地延长了代理可以自主运行的时间。
- 优势: 提升了模型性能,因为它只需关注最相关的信息。
2. 记忆工具 (Memory Tool)
该工具允许 Claude 通过一个基于文件的系统,在上下文窗口之外存储和查询信息。代理可以在一个专用的、持久化的目录中创建、读取、更新和删除文件。
- 运作方式: 完全通过工具调用在客户端操作,开发者可以完全控制数据的存储位置和方式。
- 功能: 代理可以逐步建立知识库,跨会话维护项目状态,并参考过去的学习成果。
Claude Sonnet 4.5 模型通过内置的上下文感知能力,能够跟踪可用空间并更有效地管理上下文,从而增强了这两项功能。
显著的性能提升
这些更新共同构成了一个能显著提升代理性能的系统:
- 通过自动移除过时内容,实现更长时间的对话。
- 通过将关键信息存入记忆,提高准确性,并让学习成果在不同会话间传递。
实际应用场景
这些功能为需要长时间运行的代理开辟了新的可能性,例如处理整个代码库或分析数百份文档。
- 编码: 代理可以清除旧的测试结果,同时将调试见解和架构决策保存在记忆中,从而在大型代码库上持续工作。
- 研究: 代理将关键发现存入记忆,同时清除过时的搜索结果,逐步建立起能提升未来表现的知识库。
- 数据处理: 代理将中间结果存储在记忆中,同时清除原始数据,从而处理那些原本会超出上下文限制的工作流程。
数据证明效果
在一项内部评估中,新功能带来了显著的性能增益:
- 上下文编辑单独使用,使代理在复杂任务上的性能提升了 29%。
- 上下文编辑与记忆工具结合,性能提升了 39%。
- 在一个包含 100 轮网络搜索的测试中,上下文编辑不仅让代理完成了原本会失败的任务,还将 Token 消耗降低了 84%。
开始使用
这些功能目前已在 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上以公开测试版的形式提供。