斯坦福法学院研究：AI 表现优于法学教授

一项由斯坦福法学院进行的研究表明，法学教授们明显更偏爱 AI 生成的答案，而不是他们同事所写的答案。在一项涉及近 3000 次匿名对比的盲测中，AI 的回答在 75% 的情况下胜出，并且被认为更不容易误导学生。这一发现表明，AI 即使在需要复杂推理和法律判断的领域也能提供高质量的教学支持，可能改变法律教育的模式，但如何负责任地加以利用仍是关键问题。

教授们更偏爱 AI

一项开创性研究发现，在回答学生关于合同法的问题时，法学教授们压倒性地偏爱 AI 生成的答案，而不是他们人类同行的回答。

在近 3000 次匿名对比中，AI 的回答在 75% 的直接较量中胜出。
参与研究的 16 位美国法学教授对 AI 回答的评价显著高于人类教授的回答。
研究人员对这一结果的“巨大程度”感到惊讶，因为测试的问题需要综合复杂材料并应用于新情况，并非只有简单的对错答案。

挑战法律推理的传统观念

这项研究之所以引人注目，是因为它专注于法律领域——一个需要判断、细致推理和处理模糊性的领域，而不仅仅是回忆事实。以往的 AI 评估大多集中在有明确正确答案的学科上。

“在大多数测试 AI 的领域，都有一个正确答案。但在法律领域，通常没有。” 耶鲁大学法学院教授 Sarath Sanga 表示，“两个对立的论点都可以是好的。我们想知道的是，AI 能否达到律师们用来评估彼此论点的潜在专业标准。在这个案例中，答案是肯定的。”

这项研究表明，大型语言模型不仅能处理事实，还能进行复杂的法律分析，其表现甚至可以与研究中最优秀的人类讲师相媲美。

严谨的研究与可靠的发现

为了确保研究的有效性，研究团队采取了多项预防措施，包括校准 AI 答案的长度和结构，并使用多种评估方法让教授们判断回答是否会误导学生。

一个最引人注目的发现是：

教授们认为 AI 回答具有教学上有害内容的比例仅为 3.5%。
相比之下，同行教授撰写的回答被标记为有害的比例为 12%。

对法律教育的潜在变革

研究结果暗示，AI 可以在法律等“富含判断力”的领域提供高质量、即时的教学支持，作为课堂教学的有力补充。

“我们的研究将注意力转移到 AI 辅导在法律等富含判断力的领域能为学习做出什么贡献。我们发现，AI 辅导员可以提供高质量、按需的支持，这可能会扩大获得专家指导的机会。”

尽管不同的 AI 模型表现各异，但即使在上下文信息有限的情况下，教授们仍然经常偏爱它们的回答。

从怀疑转向负责任的部署

目前，全美的法学院都在努力将 AI 工具融入教学，同时又要保持严格的学术标准。这项研究并非主张全面采用 AI 辅导员，因为如何最有效地利用这些工具来提高学生学习仍然是一个悬而未决的问题。

研究人员强调，现在的讨论重点应该从“AI 能否给出高质量的回答”转移到“我们如何能负责任地部署它，以造福我们的学生”。数据表明，对 AI 持完全怀疑的态度可能和盲目接受一样站不住脚。