Synth Daily

德勤因在44万澳元报告中使用AI,将向澳大利亚政府退款

德勤将向澳大利亚政府退还部分款项,因为其一份价值44万澳元的报告被发现存在多处错误。该公司承认在撰写报告时使用了生成式人工智能(AI),但坚称AI并非导致错误的原因。此事引发了对咨询公司服务质量的质疑,一位参议员甚至批评德勤存在“人类智能问题”。

报告出错与退款

德勤受澳大利亚就业与劳资关系部(DEWR)委托,审查用于自动化处理求职者福利处罚的合规框架及其IT系统。

  • 报告价值:44万澳元。
  • 核心问题:报告被发现包含多处错误,包括不存在的参考文献和引文。
  • 最终结果:德勤同意退还合同的最后一笔款项。

尽管报告被修正,但政府部门表示,其核心建议没有改变。德勤也坚持认为,更新并未影响报告的实质性内容和调查结果。

AI的角色与争议

德勤在更新后的报告中承认,部分内容“使用了生成式人工智能(AI)大型语言模型(Azure OpenAI GPT-4o)”。

然而,该公司并未将AI列为导致原始报告出错的原因。这一立场引发了外界的广泛批评和质疑。

德勤存在一个人类智能问题。如果不是那么可悲,这件事简直就是个笑话。部分退款看起来像是对不合格工作的部分道歉。

错误的性质:“AI幻觉”

悉尼大学学者克里斯托弗·拉奇博士是首个发现这些错误的人。他将这些问题归因于AI的“幻觉”,即模型为了填补信息空白而编造内容。

  • 虚构引用:报告引用了悉尼大学和瑞典隆德大学教授根本不存在的报告。
  • 捏造判例:报告还引用了一个虚构的法院判决案例。
  • 证据缺失:拉奇博士指出,修正版用五到八个新引用替换了一个虚假引用,这暗示“报告正文中的原始主张并非基于任何特定的证据来源”。

对咨询行业的警示

工党参议员黛博拉·奥尼尔对此事提出了尖锐批评,认为这暴露了咨询行业的深层问题。

她建议,未来与这些公司签约时应明确以下几点:

  • 到底是谁在做他们付费的工作?
  • 确保其专业性,并核实未使用AI。

她讽刺地评论道:

也许采购方不应该找大型咨询公司,而是直接订阅一个 ChatGPT 账户会更好。