Synth Daily

美国有个全字母句问题

AI 检测工具 Pangram 已成为判断文本是否由 AI 生成的行业标准,被媒体、学校和学术界广泛采用。尽管它比早期工具更准确,但其固有的“黑箱”问题无法完全被信任的可靠性也带来了巨大的风险。它难以区分 AI 辅助AI 生成的界限,导致错误的指控和名誉损害。最终,AI 检测工具本身正变得和它所追踪的 AI 技术一样:足够有用,但远未达到可以完全信赖的程度。

“金标准”的崛起与争议

近期几乎所有高调的 AI 写作指控都源于一个名为 Pangram 的工具。从被下架的恐怖小说到知名报纸的文章,Pangram 的检测结果被广泛引用,使其迅速成为权威。大学用它审查学生作业,科研机构用它扫描论文。

  • 看似可靠: 早期的 AI 检测工具(如 ZeroGPT)曾将美国宪法标记为 AI 生成,而 OpenAI 也因准确率低而放弃了自己的检测器。相比之下,Pangram 的表现要好得多。
  • 高调应用: 它被用来指控主流媒体、文学奖项得主,甚至教皇的通谕中存在 AI 生成内容。

然而,一个大部分时候可靠的 AI 检测器,在某些方面可能比一个完全坏掉的检测器更危险。

可靠性背后的双刃剑

Pangram 拥有摧毁声誉和职业生涯的能力,但它确实会犯错,其错误的程度可能比目前所理解的要大得多。

  • 极低的误报率: Pangram 声称,其将人类写作错误识别为 AI 生成的概率仅为 1/10000。多项独立分析也证实了其较低的假阳性率。
  • 更高的漏报率: 但其将 AI 文本错误识别为人类写作的概率(假阴性率)则要高得多,接近 1/70。这意味着它在识别“人类写作”的保证上并不稳固。

这种情况导致了一种困境。一位纽约的高中教师表示,他明知一些学生的作业有问题,但 Pangram 显示为 100% 人类写作。他不敢仅凭怀疑就指控学生,因为“赌注太高了,但我们评估 AI 生成内容的方式仍然很不成熟。”

技术军备竞赛与“黑箱”困境

Pangram 面临的挑战是双重的。一方面,它需要追赶不断进化的 AI 模型;另一方面,它还要应对专门用于掩盖 AI 痕迹的工具。

  • AI 人性化工具 (Humanizers): 像 Walter Writes AI 这样的程序,可以通过调整措辞和句式来“人性化”AI 生成的文本,从而轻松骗过 Pangram 的检测。
  • 无法解释的“黑箱”: Pangram 的算法通过海量数据训练来识别模式,但它无法具体解释为什么将某段文本判定为 AI 或人类所写。其创始人也承认,算法的内部工作原理是“相当无法解释的”。

我们在担忧过度依赖 AI 聊天机器人时,有可能陷入依赖另一个黑箱算法的风险中。

现实世界的后果:诽谤机器?

由于其结果的模糊性和争议性,Pangram 很容易被滥用或误解,导致严重的后果。

  • 错误的指控: 科技记者 Taylor Lorenz 曾被错误指控使用 AI 写作,事后 Pangram 承认了错误。
  • 混淆“辅助”与“生成”: 《华尔街日报》的一位编辑称 Pangram 为“诽谤机器”,因为它将使用了 AI 辅助修订的专栏文章标记为 AI 生成,这种区分的模糊性很容易在恶意或无意中被混淆。
  • 重演历史: 这种情况让人联想到近期的“抄袭战争”,当时算法被用来指控学术领袖,引发巨大争议。即将到来的 AI 检测战争可能更具争议性。

Pangram 并非毫无用处,但这恰恰是问题的关键。当没有人就 AI 的道德使用范围达成共识时,它的结论太容易被扭曲和质疑。就像聊天机器人一样,AI 检测工具已经变得足够有效以至于被广泛使用,但又不够可靠以至于无法完全信任。从这个角度看,Pangram 这类检测器正是它们所追踪的 AI 产品的镜像。