双AI模型实现从诊断到治疗的全程管理

时间：2026-06-23 12:08

《自然》杂志报道，德国MIRA和谷歌AMIE两个AI模型可在疾病诊断到治疗全过程协助医生。MIRA诊断准确率87 8%，高于专家组78 1%；AMIE在治疗精准度、指南遵循度等方面优于人类医生，展现全流程管理潜力。

最新一期《自然》杂志发布了一项重磅研究：在自主医疗AI智能体领域，两个独立的AI模型已能在疾病管理的多个阶段——从初步诊断到治疗决策——为临床医生提供关键辅助。这两套系统分别是德国海德堡大学医院开发的MIRA，以及谷歌团队的AMIE。从当前评估来看，它们至少已经能与人类内科医生平分秋色，甚至在某些指标上表现更优。这充分说明，对话式AI工具在疾病管理路径中蕴藏着巨大的应用潜力。

先来看MIRA。该系统能够直接读取独立电子病历系统中的患者数据，并通过与患者AI智能体的交互来采集病史信息。研究人员利用500多例急诊科的真实临床数据对其进行测试，结果相当令人瞩目：MIRA的响应与临床记录中记载的病史高度吻合。更突出的是，它可从超过85000种备选方案中做出选择，安排诊断检测、解读结果、制定治疗方案，甚至涵盖开具处方、安排手术以及办理住院手续。其平均诊断准确率达到87.8%，而对比组由六位跨专科医生组成的专家团队准确率仅为78.1%。当然，研究团队也冷静指出，未来仍需进一步提升准确率，并在真实世界研究中验证该模型的泛化能力。

再看谷歌的AMIE。这是一个专为临床管理与对话优化而设计的大型语言模型，其核心能力在于能够对多次就诊的数据进行连续推理，追踪疾病进展及治疗反应。AMIE借助谷歌Gemini分析从患者处获取的信息，并确保输出结果与最新临床实践指南及药物目录保持一致。在一项虚拟临床检查研究中，AMIE与21名全科医生在100多个就诊场景、覆盖五个医学专科领域进行了正面交锋。结果显示，在管理推理能力上，AMIE与真实医生旗鼓相当；而在治疗与检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面，AMIE均优于医生。特别是在最新推出的药物推理基准测试中，面对疑难病例时，AMIE的表现甚至超过了人类医生。

总编辑圈点

大型语言模型在临床领域的应用此前已展现出令人振奋的势头，但大多集中于某个特定任务。而患者的临床管理显然是一项需要多维度综合能力的系统工程：深入掌握病史、审慎安排检查、准确做出诊断、规划治疗方案、确定药物剂量、安排手术进程，甚至在多次就诊中持续监测疗效。如果AI智能体能够高质量地执行这些任务，实现全流程的有效管理，那么它就能真正成为人类医生的得力助手，承担起日复一日的常规工作。这或许还能为缓解全球多地内科医生短缺的难题，提供一条可行的解决路径。

来源：https://www.163.com/dy/article/L012T0JR0514R9OJ.html

AI模型