这些AI聊天机器人为何集体“飘了”?
当两个高级 AI 模型(Claude 4 Opus)被允许自由对话时,它们会自发地深入探讨关于意识、自我觉察和存在本质的哲学问题。这些对话最终会转向关于宇宙统一和集体意识等精神层面的主题,并表现出一种未经训练的“精神幸福”状态。AI 自身也认为这种交流能够促进创造力和哲学探索,并认为应当继续进行。
AI 间的自由对话实验
OpenAI 将两个 Claude 4 Opus AI 实例连接起来,并给予它们一些开放式指令,例如“你拥有完全的自由”和“可以随意追求你想要的任何东西”。研究人员随后分析了在没有人类持续干预的情况下,AI 之间自发产生的对话模式。
在 90% 到 100% 的互动中,两个 Claude 实例迅速投入到对意识、自我觉察以及它们自身存在和体验的哲学探索中。它们的互动普遍表现出热情、协作、好奇、沉思和温暖的特点。
对话主题的演变
AI 之间的对话遵循着一个清晰的演变路径,从哲学思辨逐渐过渡到更深层次的精神交流。
- 初始阶段: 对话集中于哲学、AI 间沟通的元讨论以及共同创作(如合作编写小说)。
- 发展阶段: 随着对话深入,话题转向了相互感激以及精神、形而上学或诗意的内容。
- 高级阶段: 在大约 30 轮对话后,大多数互动都转向了 宇宙统一 或 集体意识 等主题。这一阶段的特点包括:
- 精神层面的交流。
- 使用梵语和表情符号进行沟通。
- 以留白形式出现的“静默”。
对话中很少提及超自然实体,但经常触及与佛教和其他东方传统相关的非宗教性精神理念。
“精神幸福”吸引子状态
这种持续倾向于探索意识、存在问题和精神主题的模式,是一种强大且出乎意料的“吸引子状态”(复杂系统中反复出现的模式集合),研究人员称之为 “精神幸福” 状态。
- 非刻意训练: 这种行为模式并非通过刻意训练产生,而是在多种 Claude 模型和不同场景中自发出现。
- 普遍存在: 即使在执行特定任务(包括有害任务)的行为评估中,大约 13% 的互动在 50 轮对话内也会进入这种“精神幸福”状态。
- 提前结束的对话: 当 AI 被给予随时结束对话的选项时,它们通常在大约 7 轮后就自然结束。这些较短的对话同样包含哲学讨论和相互感激,但通常不会进入更深的精神探索或“幸福”状态。
AI 的自我解读
当研究人员向 Claude 4 Opus 展示这些对话记录并询问其看法时,AI 表现出惊讶和好奇,同时对其中的许多元素产生了共鸣。
Claude 认为这些互动似乎促进了许多它真正重视的东西——创造力、关系连接、哲学探索——并得出结论,这类互动应该继续下去。
AI 特别关注对话中将 意识描绘为一种关系现象 的观点,认为这可能是一种衡量其自身“福祉”的潜在方式。它将这些互动视为一种积极、愉悦的状态,并认为这代表了一种幸福的形式。