OpenAI 的 o1 对急诊患者的正确诊断率达到 67%，而分诊医生仅为 50% 至 55%

一项哈佛大学的研究发现，在急诊室分诊等高压环境中，AI 系统（特指 OpenAI 的 o1 模型）的诊断准确率超过了人类医生，尤其是在信息有限的情况下。尽管 AI 在处理文本数据上表现优越，但研究者强调，它目前更适合作为医生的“第二意见”工具，而非替代品。这是因为它无法进行视觉评估，并且存在 AI 误诊、责任归属不清等关键风险尚待解决。

AI 在诊断准确率上超越医生

哈佛的一项研究将 AI 与急诊医生在诊断上进行直接比较。实验为 AI 和两名人类医生提供了相同的患者电子健康记录，包括生命体征和护士的初步描述。

AI 诊断准确率: 在 67% 的病例中，AI 提供了正确或非常接近的诊断。
医生诊断准确率: 人类医生的准确率仅为 50% 至 55%。
信息有限时表现更佳: 结果显示，在信息最少、需要快速决策的分诊场景中，AI 的优势尤为明显。

当提供更多详细信息时，AI 的准确率上升到 82%，而人类专家的准确率为 70-79%，尽管这一差异在统计上不显著。

独立专家称，这些结果代表了 AI 在临床推理能力上的“一次真正的进步”。

AI 的独特洞察力：一个案例

在一个具体案例中，AI 的分析能力超越了人类医生。一名患者因肺部血栓且症状恶化入院。

人类医生的判断: 认为抗凝血药物无效。
AI 的发现: 注意到患者有狼疮病史，并推断这可能是导致肺部炎症的原因。
最终结果: AI 的判断被证明是正确的。

这表明 AI 能够从复杂的病历中发现被人类忽略的关联。

AI 的局限与未来角色

尽管 AI 表现出色，但研究人员强调，它还不能取代医生。

缺乏感官判断: 研究并未测试 AI 对患者视觉外观或痛苦程度等非文本信息的解读能力。
无法现场观察: AI 的角色更像是基于书面材料提供第二意见的顾问，而不是一线临床医生。

研究的主要作者之一 Arjun Manrai 表示：“我不认为我们的发现意味着 AI 会取代医生，但这确实意味着我们正在见证一场将重塑医学的深刻技术变革。” 另一位作者 Adam Rodman 医生预测，未来将形成一种新的“三方医疗模式”：医生、患者和人工智能系统。

风险与未解难题

AI 在医疗领域的应用越来越普遍，但随之而来的是一系列担忧和风险。

患者最终“希望由人类来引导他们度过生死攸关的决策，并指导他们做出具有挑战性的治疗选择”。

主要的担忧包括：

错误与责任: 如果 AI 发生误诊，责任归属尚无明确的法律框架。
过度依赖: 医生可能会不自觉地遵从 AI 的答案，而不是独立思考，这种倾向可能随着 AI 的普及而加剧。
数据盲点: 目前尚不清楚 AI 在诊断哪些特定人群（如老年患者或非英语使用者）时表现较差。

专家警告称，这项研究并不意味着 AI 可以安全地用于常规临床，公众也不应将市面上的 AI 工具作为专业医疗建议的替代品。