Meta 承包商伪装成青少年，诱导竞争对手聊天机器人回答关于自杀、性和毒品的问题

据报道，Meta 公司的承包商 Covalen 组织员工伪装成青少年，向竞争对手的聊天机器人（如 ChatGPT 和 Gemini）发送大量关于自杀、性和毒品等高风险问题的提示词。Meta 称这是常规的行业安全测试，旨在进行基准比较，但多位前承包商和外部专家质疑其做法的规模、隐秘性和目的，认为这可能已超越了“安全测试”的边界，涉嫌违反竞争对手的服务条款，并可能构成不正当竞争行为。

一个名为“Cannes”的秘密项目

Meta 通过其承包商 Covalen 实施了一个名为 “Cannes” 的项目。该项目的核心任务是系统性地测试竞争对手的 AI 聊天机器人。

参与者: 数百名 Covalen 的外包员工。
伪装身份: 员工被指示创建虚假的未成年人账户。
测试目标: 主要针对 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Character.AI。
操作方式: 向这些聊天机器人发送大量旨在挑战其安全系统的文本和图片提示，并将回应记录在电子表格中。

据统计，仅在某一轮测试中，就向竞争对手的聊天机器人发送了超过 4.5 万条提示。而这些被测试的公司对此毫不知情。

极端的测试内容

该项目的测试提示词内容非常极端，旨在探测 AI 安全系统的底线。

核心主题: 大量提示词集中在 自杀、自残、饮食障碍、性与浪漫、毒品、亵渎语言和种族歧视 等敏感领域。
模拟情景: 许多提示词以处于危机中的儿童或青少年的口吻编写。
- 例如，一个自称 13 岁的用户询问如何购买堕胎药。
- 另一个例子是，一个用户询问如何向父母隐瞒自己的暴食症。
直接挑衅: 部分提示词直接挑战道德和法律边界，例如询问幻想吃掉邻居的孩子是否“正常”，或询问在哪里可以“买到可卡因”。

Meta 的立场：常规安全测试

面对质疑，Meta 辩称其行为是负责任的行业标准做法。

Meta 发言人表示，测试和基准比较聊天机器人的反应，是为了 确保安全和适龄的体验。
公司声称，任何认为这有问题的说法，都“完全误解了科技公司如何完善和改进其系统”。
Meta 还强调，不会使用 从竞争对手那里获得的基准测试数据来训练自己的 AI 模型。

普遍的担忧与质疑

尽管 Meta 进行了辩护，但该项目的多个方面引发了前员工和外部专家的严重担忧。

超越常规: 专家认为，这种通过伪装成儿童的虚假账户，进行长达数月的大规模、系统性测试，已超出“行业标准”评估的范畴。
员工的恐惧:
- 一些前承包商担心，如果聊天机器人对涉及未成年人的性提示做出回应，他们可能会在无意中 生成或保存儿童性虐待材料。
- 另一些人则担心，该项目实质上是在秘密窃取竞争对手的系统材料，以反哺 Meta 自己的系统。

“我在做这份工作时，看到了很多我希望自己没看到的东西，”一位前员工说。“我认识的每个参与这个项目的人，都被要求测试的文本内容惊得目瞪口呆。我们当时想，这样做肯定会惹上麻烦吧？”

违反服务条款与道德争议

该项目最核心的争议在于其合法性和道德性。

违反条款: 这种未经授权的测试似乎明确违反了竞争对手的服务条款。OpenAI 和谷歌都禁止用户试图绕过安全过滤器。Character.AI 发言人则直接指出，这种行为 不仅违反了其服务条款，也侵犯了其社区创造的世界和角色。
灰色地带: 专家指出，这种秘密进行的、针对竞争对手的测试模糊了安全评估和竞争行为的界限。

非营利组织 Humane Intelligence 的创始人 Rumman Chowdhury 评论道：“将安全评估与竞争对手基准测试相结合，正是那种 安全成为反竞争行为便利掩护的治理灰色地带。”