最新一期《自然》杂志发布了一项重磅研究:在自主医疗AI智能体领域,两个独立的AI模型已能在疾病管理的多个阶段——从初步诊断到治疗决策——为临床医生提供关键辅助。这两套系统分别是德国海德堡大学医院开发的MIRA,以及谷歌团队的AMIE。从当前评估来看,它们至少已经能与人类内科医生平分秋色,甚至在某些指标上表现更优。这充分说明,对话式AI工具在疾病管理路径中蕴藏着巨大的应用潜力。

先来看MIRA。该系统能够直接读取独立电子病历系统中的患者数据,并通过与患者AI智能体的交互来采集病史信息。研究人员利用500多例急诊科的真实临床数据对其进行测试,结果相当令人瞩目:MIRA的响应与临床记录中记载的病史高度吻合。更突出的是,它可从超过85000种备选方案中做出选择,安排诊断检测、解读结果、制定治疗方案,甚至涵盖开具处方、安排手术以及办理住院手续。其平均诊断准确率达到87.8%,而对比组由六位跨专科医生组成的专家团队准确率仅为78.1%。当然,研究团队也冷静指出,未来仍需进一步提升准确率,并在真实世界研究中验证该模型的泛化能力。
再看谷歌的AMIE。这是一个专为临床管理与对话优化而设计的大型语言模型,其核心能力在于能够对多次就诊的数据进行连续推理,追踪疾病进展及治疗反应。AMIE借助谷歌Gemini分析从患者处获取的信息,并确保输出结果与最新临床实践指南及药物目录保持一致。在一项虚拟临床检查研究中,AMIE与21名全科医生在100多个就诊场景、覆盖五个医学专科领域进行了正面交锋。结果显示,在管理推理能力上,AMIE与真实医生旗鼓相当;而在治疗与检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE均优于医生。特别是在最新推出的药物推理基准测试中,面对疑难病例时,AMIE的表现甚至超过了人类医生。
总编辑圈点
大型语言模型在临床领域的应用此前已展现出令人振奋的势头,但大多集中于某个特定任务。而患者的临床管理显然是一项需要多维度综合能力的系统工程:深入掌握病史、审慎安排检查、准确做出诊断、规划治疗方案、确定药物剂量、安排手术进程,甚至在多次就诊中持续监测疗效。如果AI智能体能够高质量地执行这些任务,实现全流程的有效管理,那么它就能真正成为人类医生的得力助手,承担起日复一日的常规工作。这或许还能为缓解全球多地内科医生短缺的难题,提供一条可行的解决路径。
