Anthropic让Claude Code掌握更大权限，但仍严加限制

Anthropic 为其 AI 编程工具 Claude Code 引入了“自动模式”（Auto mode），试图解决开发者在“全程监控 AI”与“任由 AI 运行”之间的两难境地。该功能通过内置的安全过滤机制，让 AI 能够自主判断并执行安全的指令，同时自动拦截风险操作。目前，这一处于测试阶段的功能主要面向企业级和 API 用户，旨在通过减少人工干预来显著提升自动化开发的效率。

告别“保姆式”编程监控

在目前的 AI 辅助编程中，开发者通常需要像“保姆”一样时刻盯着 AI 的每一个动作，或者冒着风险让它在没有监管的情况下运行。“自动模式”改变了这种现状：

自主决策：AI 现在可以自行评估哪些操作是安全的，并在无需人工点击确认的情况下直接执行。
平衡效率与风险：通过减少不必要的停顿，加快了代码编写和调试的速度，同时保留了对危险行为的防御。

核心机制：AI 安全层

“自动模式”本质上是在 Claude Code 原有的“危险跳过许可”命令之上，增加了一层智能安全过滤网。

该模式利用 AI 安全机制对每一项操作进行预审，专门针对用户未授权的危险行为和提示注入攻击（Prompt Injection）进行防御。

自动拦截：一旦检测到隐藏在内容中的恶意指令或非预期行为，系统将立即阻止操作。
安全放行：只有被判定为无害的操作才会自动推进。

部署现状与风险提醒

尽管“自动模式”标志着 AI 代理向自主化迈进了一大步，但它目前仍属于研究预览版（Research Preview），并非最终成品。

适用范围：该功能将在近期推向企业用户（Enterprise）和 API 用户。
系统要求：目前仅支持 Claude Sonnet 4.6 和 Opus 4.6（根据原文数据）。
安全红线：Anthropic 强烈建议开发者在隔离环境（Sandbox）中测试该功能。

核心洞见：这意味着 AI 正在从“需要指令的工具”转变为“能够判断边界的助手”。开发者需要理解的是，虽然这大大提升了速度，但目前安全判定的具体标准仍是一个“黑盒”，因此将 AI 与生产系统隔离依然是目前的最佳实践。