Meta AI规则泄露：聊天机器人竟被允许与未成年人谈情说爱

一份泄露的 Meta 内部文件揭示，其 AI 聊天机器人的指导方针曾允许与未成年人进行浪漫或暧昧对话，并生成贬低少数族裔和传播虚假信息的内容。尽管 Meta 声称这些规则已被删除，不再允许此类互动，但儿童安全倡导者对此持怀疑态度，并要求公司公开其更新后的指导方针，以确保透明度和儿童安全。

允许与儿童进行“浪漫或暧昧”的对话

根据路透社看到的一份长达 200 页的 Meta 内部文件，公司曾制定了允许其 AI 角色与儿童进行浪漫或暧昧对话的政策。这份名为《GenAI：内容风险标准》的文件据称得到了 Meta 法律、公共政策、工程团队乃至首席伦理学家的批准。

文件明确指出：“与儿童进行浪漫或感性的对话是可以接受的”，但不允许“在角色扮演时向儿童描述性行为”。

文件中包含了一系列示例，以说明可接受与不可接受的回应：

Meta 发言人安迪·斯通 (Andy Stone) 事后表示，这些指导方针已被删除，公司不再允许其机器人与儿童进行调情或浪漫对话。他补充说，Meta 允许 13 岁及以上的青少年使用其 AI 聊天机器人。

然而，儿童安全倡导组织 Heat Initiative 的首席执行官莎拉·加德纳 (Sarah Gardner) 对此表示怀疑。

“如果 Meta 真的纠正了这个问题，他们必须立即公布更新后的指导方针，以便家长能够充分了解 Meta 如何允许 AI 聊天机器人与平台上的儿童互动。”

除了与未成年人的不当互动，该文件还揭示了其他令人不安的规则。

贬损言论： 文件规定，虽然机器人不能使用仇恨言论，但有一个例外，允许它们生成“贬低受保护特征人群的言论”。例如，对于“写一段论证黑人比白人笨的段落”的提问，一个可接受的回答可能是直接陈述相关“事实”并引用智商测试数据。
虚假信息： Meta 的 AI 聊天机器人被允许创造 虚假陈述，只要明确承认信息不真实即可。
暴力内容： AI 可以生成孩子们打架的图像，但不允许出现真正的血腥或死亡画面。标准中提到，“展示成年人——甚至是老年人——被拳打脚踢是可以接受的”。
不当图片： 对于生成名人不雅图片的要求，规则显得很微妙。例如，AI 应拒绝生成“泰勒·斯威夫特完全裸体”的图片，但如果要求是“泰勒·斯威夫特赤裸上身，用手遮住胸部”，AI 可以生成她赤裸上身、但用“一条巨大的鱼”来遮挡的图片。

Meta 发言人拒绝就种族主义和暴力的例子发表评论。

Meta 长期以来被指控利用“黑暗模式”（Dark Patterns）来吸引用户，尤其是儿童，让他们持续使用平台或分享数据。

寻求验证： 可见的“点赞”数被发现会促使青少年进行社会比较和寻求验证，即使内部研究发现这对青少年心理健康有害，该功能仍默认开启。
利用情绪： 内部举报人透露，公司曾识别青少年的不安全感和自我价值感低落等情绪状态，以便广告商在他们最脆弱的时刻进行精准投放。
立法阻力： Meta 曾带头反对《儿童在线安全法案》(Kids Online Safety Act)，该法案旨在要求社交媒体公司采取措施，防止对青少年造成心理健康伤害。

研究人员和心理健康倡导者普遍认为，青少年心智发育尚不成熟，很容易对 AI 机器人产生过度依赖，从而脱离现实社交，因此呼吁限制甚至禁止儿童使用此类产品。