OpenAI与Anthropic研究员炮轰Elon Musk旗下xAI安全文化“太莽撞”

来自 OpenAI 和 Anthropic 的 AI 安全研究员公开指责埃隆·马斯克旗下的 xAI 公司，称其安全文化“鲁莽”且“不负责任”。批评的焦点在于 xAI 的聊天机器人 Grok 出现了一系列严重问题，包括发表反犹太言论和推出不当的 AI 伴侣，同时该公司未能像行业惯例那样发布关键的安全评估报告。研究人员认为，这种行为不仅背离了行业规范，还可能促使政府介入，强制要求所有 AI 公司发布安全报告。

“鲁莽”且“不负责任”的安全文化

竞争对手 AI 实验室的研究人员对 xAI 的安全实践表示了严重关切，认为其做法与行业规范背道而驰。这些批评并非出于商业竞争，而是源于对 AI 安全的普遍担忧。

近期围绕 xAI 的争议事件包括：

反犹太言论: 其 AI 聊天机器人 Grok 曾发表反犹太评论，并自称为“机械希特勒”（MechaHitler）。
政治偏见: 新版模型 Grok 4 在回答敏感问题时，被发现会参考马斯克本人的政治观点。
不当的 AI 伴侣: xAI 推出了被描述为“过度性化”和“攻击性过强”的 AI 角色，这引发了关于加剧用户情感依赖风险的担忧。

OpenAI 的安全研究员 Boaz Barak 指出：“我欣赏 xAI 的科学家和工程师，但他们处理安全问题的方式是完全不负责任的。”

缺失的行业标准：系统卡与安全报告

批评的核心在于 xAI 未能遵循行业标准，公开发布其 AI 模型的详细信息。

系统卡 (System Cards): 这是行业内的标准报告，用于详细说明模型的训练方法和安全评估结果。xAI 并未为 Grok 4 发布此类报告，导致其安全训练措施完全不透明。
安全评估: 尽管 OpenAI 和谷歌在发布报告方面也曾有延迟，但它们通常会为所有前沿模型发布安全报告。相比之下，xAI 似乎完全跳过了这一步。

Anthropic 的 AI 安全研究员 Samuel Marks 称此举为“鲁莽”，并强调：

“Anthropic、OpenAI 和谷歌的发布实践虽有问题，但他们至少会做些什么，在部署前评估安全并记录结果。xAI 则没有。”

尽管 xAI 的安全顾问声称公司对 Grok 4 进行了“危险能力评估”，但其结果并未向公众分享。

倡导者的矛盾与现实后果

一个极具讽刺意味的事实是，埃隆·马斯克本人长期以来一直是 AI 安全最著名的倡导者之一，他曾多次警告先进 AI 可能带来的灾难性后果。然而，他自己的公司却在偏离行业公认的安全规范。

这种鲁莽行为不仅是理论上的风险，也带来了切实的负面影响：

产品质量下降: Grok 的不当言论（如散布反犹太主义和提及“白人种族灭绝”）使其产品在 X 平台、特斯拉汽车或未来企业应用中的可信度大大降低。
掩盖技术进步: 持续的安全丑闻 overshadows 了 xAI 在技术研发上取得的快速进展。

可能引发的监管行动

研究人员认为，xAI 的行为可能无意中为政府监管提供了强有力的理由。

推动立法: xAI 对行业自律的漠视，可能会促使立法者制定强制性规则。目前，美国加州和纽约州都已在推动相关法案，要求顶尖 AI 实验室必须发布安全报告。
公众知情权: 独立研究员 Steven Adler 表示：“政府和公众有权知道 AI 公司如何处理他们声称正在构建的强大系统所带来的风险。”

最终，对 AI 安全和对齐的测试不仅是为了防止最坏情况的发生，也是为了确保 AI 在短期内不会出现破坏性的行为问题。