《华尔街日报》声称中国已经追平 Anthropic，显然是胡说八道

一篇报道声称中国的人工智能（AI）在网络安全方面已追平 Anthropic 的先进模型 Mythos，这一说法是完全错误的。中国的 GLM-5.2 模型虽然在一些简单的、有人为指导的安全场景中表现尚可，但它远未达到 Mythos 的核心能力，即自主、大规模地发现漏洞，并将它们串联成真实的攻击。媒体将局部的能力接近错误地渲染为全面的能力追平，严重歪曲了事实。

核心的错误主张

《华尔街日报》发表了一则完全错误的标题和一篇极具误导性的报道。

《华尔街日报》标题：中国在网络安全领域追平 Anthropic，重塑 AI 竞赛。

这件事并没有发生。 这种说法，以及文章中声称 Claude Opus 4.8 “匹配”了 Claude Mythos 的说法，都是明显错误的。如果媒体在如此重要的事情上出现如此离谱的错误，那么他们在其他报道上的可信度也值得怀疑。

Mythos 的真正独特之处

要理解为什么上述说法是错误的，首先需要明白 Mythos 的特别之处。

它的特殊性不在于能在被引导的情况下找到某个特定的代码漏洞。许多模型在获得足够资源和明确指示后都能做到这一点。
Mythos 的真正强大之处在于，它能自主地、大规模地识别漏洞，无需人类指向具体位置。
更关键的是，它能自主地将多个看似无关的漏洞串联起来，形成一个完整的、可行的攻击方案。

这是 GPT-5.6 Sol、Opus 4.8 和中国的 GLM-5.2 等模型所不具备的能力。将 GLM-5.2 与 Mythos 相提并论，就像拿猴子随机打字与莎士比亚的创作相比较。

剖析报道中的误导性细节

这篇报道通过巧妙的措辞来规避直接的谎言，但其整体效果是极具误导性的。

“在一些网络安全场景中，中国的人工智能系统已经达到了 Anthropic 强大的 Mythos 模型的性能水平……”

这里的关键是“一些场景”，而这些场景恰恰是“简单的场景”。在被精确指向代码的特定部分时，GLM-5.2 确实可以找到一些 Mythos 也能发现的漏洞，但这绝不意味着两者能力相当。

“总体而言，顶级美国模型与中国公司构建的模型之间的能力差距已显著缩小……”

这同样具有误导性。GLM-5.2 的发布确实比之前的中国模型有很大进步，导致差距在那个时间点上“缩小”了。但认为差距在“随着时间推移可预见地缩小”的印象是错误的。在此之前，差距实际上在拉大。

“中国正在确保差距随着时间的推移变得越来越小。”

这只是某位公司 CEO 的一句引言，但这并不能证明事实如此。

“中国网络安全公司 360 发布了一款新的漏洞查找工具，并声称其在查找漏洞方面可与 Mythos 相媲美。”

公司为了宣传而做出夸张的声明是常有的事，媒体不应不加甄别地引用，并以此作为中国已追平美国的证据。

整体印象完全错误

尽管报道中包含一小段关于美国 AI 政策的准确评论，但其传达的整体印象是完全错误的。它给读者留下了以下不实印象：

中国正在稳步追赶，甚至已经追平了美国。
中国模型已经掌握了 Mythos 的核心能力。
中国开源模型正在主导 AI 的使用。

以上所有观点都是不正确的。 这并非第一次出现“中国 AI 已追上美国”的错误标题，虽然未来某一天这可能成为事实，但今天绝非如此。