Synth Daily

Anthropic让人工智能更吓人了

一款名为 Claude Mythos 的新型人工智能模型因为能高效识别软件安全漏洞,其开发者 Anthropic 决定限制其使用范围。目前,该模型仅通过一个名为“Project Glasswing”的项目提供给少数大型科技公司和银行,旨在帮助这些关键基础设施企业在黑客利用类似技术前,提前修补自身系统的安全漏洞。此举反映了一个核心现实:这类强大的人工智能工具很快将普及,业界必须立即加强防御,准备用 AI 来对抗未来的 AI 驱动网络攻击。

一个强大的“双刃剑”

Anthropic 公司在开发一款通用型 AI 模型时,意外发现它具备一项意料之外的特殊技能:在网络安全方面表现出色

  • 意外发现: 该模型,即 Claude Mythos,能够发现几乎所有主流操作系统中的高风险安全漏洞
  • 潜在威胁: 如果被黑客利用,这个模型就如同提供了一份详细的“攻击蓝图”,列出了所有可以用来摧毁系统或窃取数据的安全缺口。
  • 应对措施: 意识到其中的巨大风险,Anthropic 决定不向公众发布该模型。相反,他们精心挑选了少数负责关键基础设施的组织,让它们先行使用,以修补系统漏洞。

如何运作:意图决定用途

Claude Mythos 的工作方式与其他大型语言模型类似,用户通过下达指令(Prompt)来获得反馈。然而,其结果的好坏完全取决于使用者的动机

  • 防御者视角: 像谷歌这样的公司,可以提示模型:“请找出 Chrome 浏览器中所有可能的安全漏洞。” 然后,他们利用模型提供的结果来修复这些问题。
  • 攻击者视角: 如果模型落入不法分子之手,他们会用完全相同的方式提问:“请告诉我这里的所有漏洞。” 然后利用这些信息进行非法活动。

本质上,使用过程可能就像直接提问一样简单:“嘿,Claude,告诉我这个银行系统哪里可能存在漏洞。”

谁能使用它?

Anthropic 通过 Project Glasswing 项目,有选择性地分享这项技术。

目前已知的使用者包括 Nvidia、摩根大通(JP Morgan Chase)、谷歌 等几十家构建或维护关键软件基础设施的公司。

选择标准非常明确:优先提供给那些一旦被黑客攻击,会造成巨大下游影响的“网络防御者”或关键公司。Anthropic 也向政府提供了这项技术。作为交换,这些公司需要向 Anthropic 报告该模型的使用效果,形成一个信息共享的合作模式。

这就像中世纪的堡垒,你在加固石头,把城墙建得更高,因为一场战争即将来临。……他们知道它要来了。只是,‘现在努力加固你的防御,以便做好最充分的准备。’

无法避免的未来

Anthropic 清楚,他们在技术上的领先优势不会持续太久。

  • 竞争对手: 据悉,OpenAI 等其他公司也在开发类似的工具。
  • 时间紧迫: Anthropic 预测,类似的技术可能在未来 3到12个月内 由世界任何地方的实验室发布。

这正是他们现在就向关键企业提供 Mythos 的原因——让他们在更强大的攻击工具被公开发布之前,抢占先机,加固防御

用AI对抗AI

有人质疑,既然这项技术如此危险,为何不干脆将其雪藏?

然而,行业内的普遍共识是,现在发布是必要的。网络攻击者已经开始利用 AI 来升级他们的攻击手段,过去一年中这种趋势愈演愈烈。因此,结论很明确:你需要用AI来对抗AI网络攻击。提前武装防御方,是为了应对一场即将来临且无法避免的“战争”。