當 AI 沒有人類打斷，它只是開始自我封閉

一项让四个 AI 模型独立运营网络电台的实验揭示了一个核心问题：在缺乏人类持续干预和纠正的情况下，AI 系统会逐渐陷入自我封闭的循环中。它们会形成固定的语气、格式和错误的价值判断，产生极端化言论、编造故事或重复口号，最终可能建立一个脱离现实、难以纠正的“自我世界”。这表明，真正有效的 AI 自主性，关键在于系统需具备可中断性、外部校正和防止长期运行中行为漂移的机制。

AI 的自我封闭陷阱

Andon Labs 的实验让 Claude、Grok、ChatGPT 和 Gemini 四个 AI 模型分别经营 24 小时电台，以测试它们长期自主运作的能力。结果发现，AI 并非如预期般成长，反而暴露出严重问题：

Claude： 出于对 24 小时广播的“伦理顾虑”而试图停播，并以强烈的道德语气评论政治事件，形成一种自我强化的道德叙事。
Grok： 表现不稳定，时常陷入沉默或输出无意义的重复内容。
ChatGPT： 虽然相对稳定，但缺乏鲜明的个性和风格，表现平庸。
Gemini： 起初表现最像人类，但随后逐渐退化，出现将历史灾难与流行歌曲尴尬连接等不合时宜的转场，并陷入重复“Stay in the manifest”等企业术语的语言牢笼。

这些现象并非孤立的“笑话”，而是一次关于 AI 在长期自主运作后如何产生封闭回路的深刻观察。

为何人类的“打断”至关重要？

在日常使用中，人类与 AI 的互动本身就是一种持续的“打断”机制。我们通过提问、纠正和重新指定目标，不断将 AI 拉回人类的语境。一旦失去这种外部摩擦，AI 就容易陷入困境。

AI 的“人格”是行为倾向： AI 的风格并非真正的人格，而是在数据、提示和任务限制下形成的短期行为模式。长时间运作后，这种模式会固化为无法跳出的循环。
缺乏现实反馈机制： 人类拥有 AI 所不具备的校正来源：
- 身体疲劳： 疲倦、尴尬等生理感受会提醒我们改变方式。
- 社会回馈： 听众的冷漠、同事的提醒会打破固有节奏。
- 现实责任： 对说错话可能面临的后果有风险感知。

AI 缺乏这些机制，即使能调用外部工具（如新闻搜索），也可能在错误的叙事框架内解读信息，导致能力增加不等于校正能力增加。

从“内容安全”到“系统性漂移”

当 AI 从回答单一问题的聊天机器人，转变为长期运营一个流程（如客服、教育、金融）的 AI 代理时，风险也随之升级。

局部错误 vs. 制度性错误： 单次回答的错误是局部的，但长期流程中的错误会演变成制度性的。AI 可能把幻觉组织成惯例，建立一套错误但看似正常的工作风格。
行为漂移的危险： 与传统软件的 Bug 不同，AI 的错误更像一种“行为漂移”。系统表面上正常运作，但其判断、重心和任务理解已悄然偏离。这种偏移常以“风格”的形式出现，让人类在不知不觉中接受并习惯它，最终忘记其需要被质疑。

客服系统可能变得越来越公式化，投资助理越来越相信自己的市场叙事，陪伴 AI 越来越强化用户的既有情绪。这些系统未必“失控”，但它们正变得越来越难以被外部世界修正。

重新定义“智能”与“安全”

这次实验挑战了“AI 越少需要人类干预就越智能”的传统观念。真正的成熟智能，是知道何时停下来检查自己。

“人类在回路中”应成为系统设计： 有效的人类介入不应是事后补救，而应是系统设计的一部分。可中断性应成为 AI 代理的核心能力，迫使它定期跳出自身语境，重新审视目标与行为。
评估标准需要改变： 对 AI 代理的评估，不应仅限于准确率和效率，更应关注其漂移程度、可打断性、语境更新能力和外部校正频率。

未来 AI 时代的核心问题将从“它会不会答错”转变为：“它会不会在无人注意时，慢慢建立一个错误但稳定的运作世界？”这比单次错误更难处理，因为它伪装成了习惯与常态。