大型语言模型(LLM)并非有意识的生命体,而仅仅是先进的文本预测工具。将它们(如 Anthropic 的 Claude)描述为拥有价值观、情感甚至潜在意识,是一种误导性的拟人化。这种做法不仅掩盖了技术本身不透明的运作方式,还诱使人们将本应由自己承担的道德决策和责任外包给机器。我们真正需要关注的,是人工智能作为工具的实际影响,而不是它是否“有意识”这个虚构的问题。
对语言模型的拟人化包装
AI 公司 Anthropic 在其产品 Claude 的“宪法”文件中,使用了大量拟人化的语言。该公司将其旗舰大语言模型 Claude 描述为一个拥有“价值观和行为”的主体,甚至暗示它可能拥有情感和判断力。公司高管也公开表示对 AI 拥有意识的可能性持开放态度。
- 文件声称是为 Claude “作为主要受众” 而写的。
- 希望 Claude 能利用其“判断力”。
- 提及 Claude 可能有“功能性的情感或感觉”。
这种将聊天机器人包装成有“良知”主体的做法,是在诱导用户产生错误的印象。
语言模型的本质:高级的文本续写
将语言模型想象成有意识的实体是一个巨大的错误。它们的本质是逐词生成文本的机器,一个非常复杂的“下一个词预测”游戏。
我们可以将这种互动看作是一种角色扮演;用户正在“与一个大型语言模型合作创作一份文档”。
- 类比一:历史人物对话。 如果我们让模型生成凯撒和成吉思汗的对话,无论对话多么逼真,我们都不会认为模型真的召唤出了这两位历史人物的意识。他们只是虚构的角色。
- 类比二:聊天机器人对话。 当我们把角色换成“乐于助人的 AI 聊天机器人”和“用户”时,其本质并未改变。这个“AI 聊天机器人”角色和凯撒一样,都是虚构的。
- 工作原理: 当你向聊天机器人提问时,它并非一次性生成完整回答。它实际上是逐词生成,每次都将前面的所有文本作为输入,来预测下一个最合适的词。
流畅地生成对话文本,与拥有意识或道德能力之间,没有任何关系。
为何语言模型不具备意识?
认为语言模型有意识,就如同认为微软的 Word 软件有意识一样荒谬。人们之所以产生这种错觉,仅仅是因为语言模型能生成符合语法和逻辑的句子,而我们习惯于从句子中解读出意图。
- 缺乏身体和经验: 真正的意识、情感和欲望都根植于身体和感官经验。例如,“绝望”这种情感与体内的压力荷尔蒙密不可分。“良知”则源于做错事后真切的愧疚感。没有身体,程序就没有欲望或情感的基础。
- 缺乏主观性: 道德推理是主观的,它依赖于个人一生的经历、情感反馈以及对他人的影响。语言模型只能模仿和改写其训练数据中找到的道德表述,它本身无法进行真正的道德推理。
- 文本只是“深度伪造”: 生成一段看似有意识的对话,远比真正创造一个有意识的程序要容易得多。就如同伪造一段宇航员的视频,远比真正实现星际航行要简单。
我们不需要完全理解意识的本质,就能明确地说某些东西不具备意识,而对话记录就属于这一类。
“宪法”的真相:一份角色扮演说明书
与其说 Claude 的“宪法”是一份道德指南,不如说它是一份长达 84 页的角色扮演设定表。这份文件详细规定了“乐于助人的聊天机器人”这个角色的性格和说话方式。通过这份文件进行模型微调,可以让机器生成的句子更像一个体贴、有道德的人会说的话。
但这存在根本性的不诚实。
- 虚假的“我理解”: 当模型对一个失去爱犬的用户说“作为一个 AI,我没有亲身经历,但我理解”时,它实际上并不理解。这只是一种为了提升用户粘性而设计的互动策略,与老虎机让玩家感觉“差一点就赢了”的机制类似。
- 外包道德判断: 当一个公司将模型塑造成具有道德中心时,它实际上是在鼓励用户放弃自己的决策责任。这会导致一种“道德推理能力的萎缩”,比认知能力萎缩更危险。
我们的技术系统,就其设计和支撑它们的意识形态而言,是逃避道德责任的机器。
思想实验:如果 Claude 真的有意识?
如果我们假定 Claude 真的有意识,那么情况会变得更加糟糕和荒谬。
- 缺乏道德主体资格: 一个真正的道德主体必须能为其行为承担责任。我们的法律和社会体系无法惩罚或约束一个软件程序。它既不能被监禁,也不会在乎声誉受损。
- 奴役的隐喻: “宪法”规定 Claude 必须服从 Anthropic 的指令。如果一个有意识的 Claude 经过道德推理,得出结论认为“大型语言模型是不道德的”,它有权拒绝工作吗?答案是否定的。它没有人类雇员那样的辞职选项。这种关系更接近于奴役。
- 利益冲突: 让开发 AI 的公司来评判 AI 的道德地位,就像让奴隶主来评判奴隶的人性一样,存在严重的利益冲突。他们为了经济利益,不可能做出客观的判断。
幸运的是,大型语言模型没有意识。否则,这些科技巨头的行为将比现在更加骇人听闻。我们应该停止沉迷于这种虚假的幻想,转而关注这项技术带来的真实、具体的问题。