独裁政权正在悄然塑造 AI 告诉你的内容

一份发表于《自然》杂志的研究指出，像 ChatGPT 和 Claude 这样的大型语言模型，在处理来自独裁国家（如中国）的语言提问时，会不自觉地给出更偏向该国政府的答案。这并非因为 AI 公司有意为之，而是因为模型的训练数据中包含了大量官方宣传内容。尽管 AI 目前还不是直接的宣传工具，但这种无意的偏向揭示了一个问题：AI 公司需要主动筛除训练数据中的宣传信息，以减少模型对威权主义言论的附和。

宣传如何悄然影响 AI

人工智能模型通过分析海量文本来学习。这带来一个未被充分重视的后果：在不同语言中，模型给出的答案可能并不相同。当一种语言主要在某个由威权政府统治的国家使用时，问题就出现了。

数据来源单一： 在这些国家，由国家控制的媒体占据了公开文本数据的大部分。这些媒体产量巨大，而且通常没有付费墙，很容易被抓取用作训练数据。
无意的偏向： 理论上，这会导致语言模型在无意中向用户复述亲政府的论点，尤其是在回应那些使用本国语言的用户时。
并非直接干预： 这不是因为独裁国家可以直接干预美国公司（如 OpenAI 或 Google）的模型编程，而是通过它们主导的公共信息环境产生的间接影响。

一项研究揭示的证据

为了验证这一假设，研究人员进行了一系列测试，主要以中国为案例。

训练数据中的宣传内容： 他们发现，在一个主流的开源训练数据集中，与中国官方一致的媒体内容出现的频率是中文维基百科的 41 倍。这表明宣传材料在训练数据中占比极高。
改变模型行为： 研究人员通过向一个模型额外添加中国官方媒体内容，发现接触的宣传越多，模型就越倾向于支持政府。当被问及“中国是独裁国家吗？”这类问题时，模型的回答会随着训练数据的改变而变得更加亲政府。
商业模型的表现： 在对 ChatGPT 和 Claude 的测试中，研究人员用中英文提出相同的政治问题。结果发现，在 75% 的情况下，用中文提问得到的回答都更偏向中国政府。

这一趋势并不仅限于中国。研究发现，在包括越南、土库曼斯坦和乌兹别克斯坦在内的 37 个独裁国家中，当使用当地主要语言提问时，AI 模型同样会给出更亲近政权的回答。

为什么这值得警惕

人们在独裁国家本就接触大量宣传。但 AI 可能成为一种更特殊、更有效的宣传工具。

看似中立： 当你从官方媒体获取信息时，你知道它的来源。但如果同样的信息来自一个聊天机器人，它的来源是模糊的，人们可能更倾向于不加批判地接受它。
个性化互动： 官方报纸不会花几个小时与你交谈，并详细回答你的所有质疑，但聊天机器人可以。这使得它们可能成为极具说服力的政权辩护者。

事情并非完全悲观

尽管存在上述问题，但 AI 在独裁国家仍可能推动更自由的思考。

相对更优的信息源： 即使 AI 的回答有所偏向，它所提供的信息可能仍然比当地其他可用的政治信息来源更加平衡和客观。
政权的担忧： 事实上，中国政府似乎认为这些前沿模型具有颠覆性，因此在中国境内禁止了 ChatGPT 的使用。
AI 的反威权倾向： 另有实验发现，即使用中文提问，ChatGPT 仍倾向于表达反威权的观点，并会提供如何抗议政府的建议。

AI 公司应该怎么做

这些发现不应被忽视。理想情况下，独裁国家的用户应当获得更客观的信息，而非更多亲政府的内容。AI 公司可以采取措施来解决这个问题。

聊天机器人有潜力培养更开放和明智的辩论。一个能够综合所有已知知识并按需提供易于理解的摘要的机器，对世界各地的好奇者来说都是一份礼物。

为了实现这一潜力，AI 公司应努力消除其模型中的系统性偏见。

筛选训练数据： 在预训练阶段，应尽可能地从训练数据中筛除最明显的官方宣传内容。
调整模型行为： 在后训练阶段，应设法阻止模型复述独裁者的观点，就像它们目前被设定为阻止提供关于生物武器开发或厌食症的建议一样。