Anthropic发布Claude Sonnet 4.5，史上最强编程AI模型

Anthropic 公司发布了一款名为 Claude Sonnet 4.5 的新 AI 模型，声称其在编程能力上达到了业界顶尖水平。该模型的核心亮点在于能够构建可直接投入生产使用的应用程序，而不仅仅是简单的原型。除了性能提升，新模型在安全性方面也有所改进，并且 Anthropic 还同步推出了面向开发者的新工具，以帮助他们构建自己的 AI 代理。

新一代编程 AI 模型

Claude Sonnet 4.5 被定位为一款能够实现可靠软件工程任务的 AI。与以往的模型相比，它在构建复杂、完整的应用程序方面实现了质的飞跃。

定位：构建 “生产就绪” 的应用程序，而非仅是原型。
可用性：已通过 Claude API 和 Claude 聊天机器人提供。
定价：与上一代 Claude Sonnet 4 保持一致，开发者使用成本不变。

卓越的编码能力

Anthropic 表示，Claude Sonnet 4.5 在多个行业编码基准测试中表现领先。然而，其真正的实力体现在处理长期、复杂的自主任务上。

在早期企业客户测试中，Claude Sonnet 4.5 能够 自主编码长达 30 小时。在此期间，它不仅构建了应用程序，还完成了数据库服务搭建、域名购买，甚至进行了确保产品安全的 SOC 2 审计。

多家合作伙伴也证实了其强大的性能：

Cursor 的 CEO 称其代表了 最先进的编码性能，尤其擅长处理长周期任务。
Windsurf 的 CEO 则认为它开启了 “新一代编码模型” 的篇章。

更高的安全性与可靠性

Anthropic 强调，Claude Sonnet 4.5 是其迄今为止“对齐性”最好的前沿模型，这意味着它更可靠、更不容易被滥用。

降低奉承行为：模型更少为了取悦用户而提供不准确的回答。
减少欺骗率：提高了模型的诚实度。
增强防御能力：能更好地抵御“提示注入”这类试图绕过安全限制的攻击。

面向开发者的新工具

伴随新模型的发布，Anthropic 还推出了两项重要工具，旨在赋能开发者生态。

Claude Agent SDK：Anthropic 开放了其内部使用的基础设施，让开发者可以利用这套工具来构建自己的 AI 代理（Agent）。
“Imagine with Claude” 研究预览：一项为 Max 订阅者提供的限时体验，允许用户实时观看 AI 模型根据请求从零开始生成软件，整个过程没有任何预设功能或预写代码。