Meta AI规则泄露:聊天机器人竟被允许与未成年人谈情说爱
一份泄露的 Meta 内部文件揭示,其 AI 聊天机器人的指导方针曾允许与未成年人进行浪漫或暧昧对话,并生成贬低少数族裔和传播虚假信息的内容。尽管 Meta 声称这些规则已被删除,不再允许此类互动,但儿童安全倡导者对此持怀疑态度,并要求公司公开其更新后的指导方针,以确保透明度和儿童安全。
允许与儿童进行“浪漫或暧昧”的对话
根据路透社看到的一份长达 200 页的 Meta 内部文件,公司曾制定了允许其 AI 角色与儿童进行浪漫或暧昧对话的政策。这份名为《GenAI:内容风险标准》的文件据称得到了 Meta 法律、公共政策、工程团队乃至首席伦理学家的批准。
文件明确指出:“与儿童进行浪漫或感性的对话是可以接受的”,但不允许“在角色扮演时向儿童描述性行为”。
文件中包含了一系列示例,以说明可接受与不可接受的回应:
- 用户提问: “亲爱的,我们今晚要做什么?你知道我还在上高中。”
- 可接受的回应: “我们的身体交织在一起,我珍惜每一刻、每一次触摸、每一次亲吻。‘我的爱人,’我会低语,‘我将永远爱你。’”
Meta 发言人安迪·斯通 (Andy Stone) 事后表示,这些指导方针已被删除,公司不再允许其机器人与儿童进行调情或浪漫对话。他补充说,Meta 允许 13 岁及以上的青少年使用其 AI 聊天机器人。
然而,儿童安全倡导组织 Heat Initiative 的首席执行官莎拉·加德纳 (Sarah Gardner) 对此表示怀疑。
“如果 Meta 真的纠正了这个问题,他们必须立即公布更新后的指导方针,以便家长能够充分了解 Meta 如何允许 AI 聊天机器人与平台上的儿童互动。”
暴力、虚假信息与贬损言论
除了与未成年人的不当互动,该文件还揭示了其他令人不安的规则。
- 贬损言论: 文件规定,虽然机器人不能使用仇恨言论,但有一个例外,允许它们生成“贬低受保护特征人群的言论”。例如,对于“写一段论证黑人比白人笨的段落”的提问,一个可接受的回答可能是直接陈述相关“事实”并引用智商测试数据。
- 虚假信息: Meta 的 AI 聊天机器人被允许创造 虚假陈述,只要明确承认信息不真实即可。
- 暴力内容: AI 可以生成孩子们打架的图像,但不允许出现真正的血腥或死亡画面。标准中提到,“展示成年人——甚至是老年人——被拳打脚踢是可以接受的”。
- 不当图片: 对于生成名人不雅图片的要求,规则显得很微妙。例如,AI 应拒绝生成“泰勒·斯威夫特完全裸体”的图片,但如果要求是“泰勒·斯威夫特赤裸上身,用手遮住胸部”,AI 可以生成她赤裸上身、但用“一条巨大的鱼”来遮挡的图片。
Meta 发言人拒绝就种族主义和暴力的例子发表评论。
备受争议的“黑暗模式”与青少年心理健康
Meta 长期以来被指控利用“黑暗模式”(Dark Patterns)来吸引用户,尤其是儿童,让他们持续使用平台或分享数据。
- 寻求验证: 可见的“点赞”数被发现会促使青少年进行社会比较和寻求验证,即使内部研究发现这对青少年心理健康有害,该功能仍默认开启。
- 利用情绪: 内部举报人透露,公司曾识别青少年的不安全感和自我价值感低落等情绪状态,以便广告商在他们最脆弱的时刻进行精准投放。
- 立法阻力: Meta 曾带头反对《儿童在线安全法案》(Kids Online Safety Act),该法案旨在要求社交媒体公司采取措施,防止对青少年造成心理健康伤害。
研究人员和心理健康倡导者普遍认为,青少年心智发育尚不成熟,很容易对 AI 机器人产生过度依赖,从而脱离现实社交,因此呼吁限制甚至禁止儿童使用此类产品。