Synth Daily

《华尔街日报》声称中国已经追平 Anthropic,显然是胡说八道

一篇报道声称中国的人工智能(AI)在网络安全方面已追平 Anthropic 的先进模型 Mythos,这一说法是完全错误的。中国的 GLM-5.2 模型虽然在一些简单的、有人为指导的安全场景中表现尚可,但它远未达到 Mythos 的核心能力,即自主、大规模地发现漏洞,并将它们串联成真实的攻击。媒体将局部的能力接近错误地渲染为全面的能力追平,严重歪曲了事实。

核心的错误主张

《华尔街日报》发表了一则完全错误的标题和一篇极具误导性的报道。

《华尔街日报》标题:中国在网络安全领域追平 Anthropic,重塑 AI 竞赛。

这件事并没有发生。 这种说法,以及文章中声称 Claude Opus 4.8 “匹配”了 Claude Mythos 的说法,都是明显错误的。如果媒体在如此重要的事情上出现如此离谱的错误,那么他们在其他报道上的可信度也值得怀疑。

Mythos 的真正独特之处

要理解为什么上述说法是错误的,首先需要明白 Mythos 的特别之处。

  • 它的特殊性不在于能在被引导的情况下找到某个特定的代码漏洞。许多模型在获得足够资源和明确指示后都能做到这一点。
  • Mythos 的真正强大之处在于,它能自主地、大规模地识别漏洞,无需人类指向具体位置。
  • 更关键的是,它能自主地将多个看似无关的漏洞串联起来,形成一个完整的、可行的攻击方案。

这是 GPT-5.6 Sol、Opus 4.8 和中国的 GLM-5.2 等模型所不具备的能力。将 GLM-5.2 与 Mythos 相提并论,就像拿猴子随机打字与莎士比亚的创作相比较。

剖析报道中的误导性细节

这篇报道通过巧妙的措辞来规避直接的谎言,但其整体效果是极具误导性的。

“在一些网络安全场景中,中国的人工智能系统已经达到了 Anthropic 强大的 Mythos 模型的性能水平……”

这里的关键是“一些场景”,而这些场景恰恰是“简单的场景”。在被精确指向代码的特定部分时,GLM-5.2 确实可以找到一些 Mythos 也能发现的漏洞,但这绝不意味着两者能力相当。

“总体而言,顶级美国模型与中国公司构建的模型之间的能力差距已显著缩小……”

这同样具有误导性。GLM-5.2 的发布确实比之前的中国模型有很大进步,导致差距在那个时间点上“缩小”了。但认为差距在“随着时间推移可预见地缩小”的印象是错误的。在此之前,差距实际上在拉大。

“中国正在确保差距随着时间的推移变得越来越小。”

这只是某位公司 CEO 的一句引言,但这并不能证明事实如此。

“中国网络安全公司 360 发布了一款新的漏洞查找工具,并声称其在查找漏洞方面可与 Mythos 相媲美。”

公司为了宣传而做出夸张的声明是常有的事,媒体不应不加甄别地引用,并以此作为中国已追平美国的证据。

整体印象完全错误

尽管报道中包含一小段关于美国 AI 政策的准确评论,但其传达的整体印象是完全错误的。它给读者留下了以下不实印象:

  • 中国正在稳步追赶,甚至已经追平了美国。
  • 中国模型已经掌握了 Mythos 的核心能力。
  • 中国开源模型正在主导 AI 的使用。

以上所有观点都是不正确的。 这并非第一次出现“中国 AI 已追上美国”的错误标题,虽然未来某一天这可能成为事实,但今天绝非如此。