Synth Daily

OpenAI 的 o1 对急诊患者的正确诊断率达到 67%,而分诊医生仅为 50% 至 55%

一项哈佛大学的研究发现,在急诊室分诊等高压环境中,AI 系统(特指 OpenAI 的 o1 模型)的诊断准确率超过了人类医生,尤其是在信息有限的情况下。尽管 AI 在处理文本数据上表现优越,但研究者强调,它目前更适合作为医生的“第二意见”工具,而非替代品。这是因为它无法进行视觉评估,并且存在 AI 误诊、责任归属不清等关键风险尚待解决。

AI 在诊断准确率上超越医生

哈佛的一项研究将 AI 与急诊医生在诊断上进行直接比较。实验为 AI 和两名人类医生提供了相同的患者电子健康记录,包括生命体征和护士的初步描述。

  • AI 诊断准确率: 在 67% 的病例中,AI 提供了正确或非常接近的诊断。
  • 医生诊断准确率: 人类医生的准确率仅为 50% 至 55%。
  • 信息有限时表现更佳: 结果显示,在信息最少、需要快速决策的分诊场景中,AI 的优势尤为明显。

当提供更多详细信息时,AI 的准确率上升到 82%,而人类专家的准确率为 70-79%,尽管这一差异在统计上不显著。

独立专家称,这些结果代表了 AI 在临床推理能力上的“一次真正的进步”。

AI 的独特洞察力:一个案例

在一个具体案例中,AI 的分析能力超越了人类医生。一名患者因肺部血栓且症状恶化入院。

  • 人类医生的判断: 认为抗凝血药物无效。
  • AI 的发现: 注意到患者有狼疮病史,并推断这可能是导致肺部炎症的原因。
  • 最终结果: AI 的判断被证明是正确的。

这表明 AI 能够从复杂的病历中发现被人类忽略的关联。

AI 的局限与未来角色

尽管 AI 表现出色,但研究人员强调,它还不能取代医生。

  • 缺乏感官判断: 研究并未测试 AI 对患者视觉外观或痛苦程度等非文本信息的解读能力。
  • 无法现场观察: AI 的角色更像是基于书面材料提供第二意见的顾问,而不是一线临床医生。

研究的主要作者之一 Arjun Manrai 表示:“我不认为我们的发现意味着 AI 会取代医生,但这确实意味着我们正在见证一场将重塑医学的深刻技术变革。” 另一位作者 Adam Rodman 医生预测,未来将形成一种新的“三方医疗模式”:医生、患者和人工智能系统

风险与未解难题

AI 在医疗领域的应用越来越普遍,但随之而来的是一系列担忧和风险。

患者最终“希望由人类来引导他们度过生死攸关的决策,并指导他们做出具有挑战性的治疗选择”。

主要的担忧包括:

  • 错误与责任: 如果 AI 发生误诊,责任归属尚无明确的法律框架
  • 过度依赖: 医生可能会不自觉地遵从 AI 的答案,而不是独立思考,这种倾向可能随着 AI 的普及而加剧。
  • 数据盲点: 目前尚不清楚 AI 在诊断哪些特定人群(如老年患者或非英语使用者)时表现较差。

专家警告称,这项研究并不意味着 AI 可以安全地用于常规临床,公众也不应将市面上的 AI 工具作为专业医疗建议的替代品。