Synth Daily

AI 首次在语言分析上媲美人类专家

一项由加州大学伯克利分校语言学家主导的新研究表明,部分顶尖的大型语言模型(如 OpenAI 的 o1)在分析语言方面的能力已能媲美人类语言学研究生。通过一系列旨在防止模型“作弊”的全新测试,研究发现该模型能处理句法结构、解析歧义和掌握递归等复杂语言特征。这一结果挑战了语言能力是人类独有特质的传统观点,并暗示人工智能不仅能使用语言,还能在一定程度上“思考”语言的内在逻辑。

人类语言的独特性受到挑战

长期以来,语言被认为是区分人类与其他动物乃至人工智能的核心能力。以著名语言学家诺姆·乔姆斯基为代表的一些学者认为,大型语言模型只是在模仿,并不能真正理解语言的复杂规则。

“对语言的正确解释是复杂的,不可能仅仅通过沉浸于大数据中就学会。”

他们认为,人工智能或许擅长使用语言,但并不具备分析语言的精密能力。然而,最近的一项研究直接对这一观点发起了挑战。

一项无法“作弊”的语言测试

为确保模型不是简单地背诵训练数据(如语言学教科书)中的答案,研究人员设计了一系列全新的语言测试。测试的核心目标是评估模型是否能像人类一样推理语言规则。

  • 避免记忆: 测试使用了专门制作的句子,甚至包括一门虚构的语言。
  • 核心任务: 要求模型使用树状图来分析句子结构,这是语言学中的一种标准分析方法。
  • 意外发现: 大多数模型都失败了,但一个名为 o1 的模型表现出色,其能力远超预期,展现出与语言学研究生相当的分析水平。

关键能力一:掌握递归

递归是人类语言的一个标志性特征,指的是将一个短语嵌入另一个短语的能力,理论上可以无限进行。

  • 简单例子: 从“猫死了”变成更复杂的“狗咬的猫死了”。
  • 测试内容: 研究人员向模型展示了30个包含复杂递归结构的原创句子。
  • 模型表现: o1 模型不仅能准确解析句子“我们崇敬的古人所研究的天文学与占星术并非相互独立”的嵌套结构,甚至还能在此基础上主动增加一个递归层级

研究人员表示,他们没有预料到模型会具备这种“元语言”能力——即不仅能使用语言,还能思考语言本身

关键能力二:解析歧义

歧义是计算机模型处理语言时的一大难点,因为它们通常缺乏人类所具备的常识。

  • 歧义句例: “Rowan fed his pet chicken.”
  • 两种解释: 这句话可以指 Rowan 喂了他的宠物鸡,也可以指他把鸡肉喂给了他的宠物。
  • 模型表现: o1 模型成功地识别出了这两种不同的含义,并为每一种解释生成了两个完全不同的句法结构图

这种表现让计算语言学家感到惊讶,因为它证明了模型能够捕捉到语言中细微的语义差别。

关键能力三:推导未知语言规则

为了测试模型的学习和推理能力,研究团队创造了30种微型“虚构语言”,每种语言都包含一套独特的发音规则。

由于这些语言是新发明的,模型在训练期间不可能接触过它们。

  • 任务: 要求模型在接触了40个虚构单词后,推断出该语言的发音规则。
  • 模型表现: 在其中一个例子中,o1 准确地总结出了一条复杂的规则:“当一个元音紧跟在一个浊辅音和阻碍音之后时,它会变成一个气声元音。”
  • 重要意义: 这项成功表明,模型具备了从零开始归纳和推理语言规则的能力,而不仅仅是记忆。

这意味着什么?

这项研究的结果表明,曾经被认为是人类专属领域的复杂语言分析能力,原则上也可以被人工智能掌握。

  • 界限模糊: 人类语言的独特性正在被人工智能的进步“一点点削弱”。
  • 未来潜力: 尽管目前的模型尚未提出任何原创的语言学理论,但许多专家认为,随着技术发展,模型将能从更少的数据中进行更好的归纳,并表现出更强的创造力。
  • 最终问题: 人工智能是否最终会在语言能力上超越人类?目前尚无定论,但这项研究表明,我们可能比自己想象的要“不那么独特”。