Anthropic让人工智能更吓人了

一款名为 Claude Mythos 的新型人工智能模型因为能高效识别软件安全漏洞，其开发者 Anthropic 决定限制其使用范围。目前，该模型仅通过一个名为“Project Glasswing”的项目提供给少数大型科技公司和银行，旨在帮助这些关键基础设施企业在黑客利用类似技术前，提前修补自身系统的安全漏洞。此举反映了一个核心现实：这类强大的人工智能工具很快将普及，业界必须立即加强防御，准备用 AI 来对抗未来的 AI 驱动网络攻击。

一个强大的“双刃剑”

Anthropic 公司在开发一款通用型 AI 模型时，意外发现它具备一项意料之外的特殊技能：在网络安全方面表现出色。

意外发现： 该模型，即 Claude Mythos，能够发现几乎所有主流操作系统中的高风险安全漏洞。
潜在威胁： 如果被黑客利用，这个模型就如同提供了一份详细的“攻击蓝图”，列出了所有可以用来摧毁系统或窃取数据的安全缺口。
应对措施： 意识到其中的巨大风险，Anthropic 决定不向公众发布该模型。相反，他们精心挑选了少数负责关键基础设施的组织，让它们先行使用，以修补系统漏洞。

如何运作：意图决定用途

Claude Mythos 的工作方式与其他大型语言模型类似，用户通过下达指令（Prompt）来获得反馈。然而，其结果的好坏完全取决于使用者的动机。

防御者视角： 像谷歌这样的公司，可以提示模型：“请找出 Chrome 浏览器中所有可能的安全漏洞。” 然后，他们利用模型提供的结果来修复这些问题。
攻击者视角： 如果模型落入不法分子之手，他们会用完全相同的方式提问：“请告诉我这里的所有漏洞。” 然后利用这些信息进行非法活动。

本质上，使用过程可能就像直接提问一样简单：“嘿，Claude，告诉我这个银行系统哪里可能存在漏洞。”

谁能使用它？

Anthropic 通过 Project Glasswing 项目，有选择性地分享这项技术。

目前已知的使用者包括 Nvidia、摩根大通（JP Morgan Chase）、谷歌 等几十家构建或维护关键软件基础设施的公司。

选择标准非常明确：优先提供给那些一旦被黑客攻击，会造成巨大下游影响的“网络防御者”或关键公司。Anthropic 也向政府提供了这项技术。作为交换，这些公司需要向 Anthropic 报告该模型的使用效果，形成一个信息共享的合作模式。

这就像中世纪的堡垒，你在加固石头，把城墙建得更高，因为一场战争即将来临。……他们知道它要来了。只是，‘现在努力加固你的防御，以便做好最充分的准备。’

无法避免的未来

Anthropic 清楚，他们在技术上的领先优势不会持续太久。

竞争对手： 据悉，OpenAI 等其他公司也在开发类似的工具。
时间紧迫： Anthropic 预测，类似的技术可能在未来 3到12个月内 由世界任何地方的实验室发布。

这正是他们现在就向关键企业提供 Mythos 的原因——让他们在更强大的攻击工具被公开发布之前，抢占先机，加固防御。

用AI对抗AI

有人质疑，既然这项技术如此危险，为何不干脆将其雪藏？

然而，行业内的普遍共识是，现在发布是必要的。网络攻击者已经开始利用 AI 来升级他们的攻击手段，过去一年中这种趋势愈演愈烈。因此，结论很明确：你需要用AI来对抗AI网络攻击。提前武装防御方，是为了应对一场即将来临且无法避免的“战争”。