自然杂志报道：人工智能医生MIRA首次全流程上岗_AI热点日报

先与大家分享一项重磅成果：2026年6月17日，Nature 刊登了一项具有里程碑意义的科研成果。来自海德堡大学医院的研究团队，成功研发了一款名为MIRA（Medical Intelligence for Reasoning and Action）的自主医疗AI智能体。与过去那些仅能提供文字建议的聊

先与大家分享一项重磅成果：2026年6月17日，Nature 刊登了一项具有里程碑意义的科研成果。来自海德堡大学医院的研究团队，成功研发了一款名为MIRA（Medical Intelligence for Reasoning and Action）的自主医疗AI智能体。与过去那些仅能提供文字建议的聊天工具截然不同，MIRA是首个能够在沙盒化电子健康记录（EHR）系统中，独立完成从问诊、检查、治疗到入院全流程的AI系统。其诊断准确率高达88%以上，显著优于专科医生团队78%的表现。在分析468条用药医嘱时，未发现任何严重的药物相互作用或剂量错误；此外，MIRA对需要收治患者的识别召回率达到了100%，无一遗漏。当然，目前所有成果均基于模拟环境。但这项研究的关键意义在于，它标志着AI从单纯的"辅助工具"，向具备"执行能力"的临床智能体迈出了至关重要的一步。未来，这类系统有望将医生从大量重复性事务中解放出来，使其能更专注于医疗中充满人文关怀的环节。

Nature: AI医生MIRA首次“全流程上岗

论文题目：Nature: Towards autonomous medical artificial intelligence agents
发表时间：2026年6月17日
论文来源：Nature (DOI: 10.1038/s41586-026-10675-5)

一、AI诊疗的转型困局：

只会答题的大模型，无法胜任全流程临床执行者角色

坦诚地说，大语言模型（LLMs）在医疗问答、影像判读、临床推理测试中，已能取得接近甚至超越医生的成绩。医疗领域也涌现出众多能够检索诊疗指南、整理病历、自动生成疾病编码的辅助工具。然而，这些工具至今仍无法独立完成一次完整的临床接诊。

问题的根源在于，绝大多数医疗AI仍停留在"被动答题者"阶段。它们虽然擅长回答问题，但仅能处理零散、割裂的单一环节。这与真实医生在电子病历系统中持续采取行动的方式不同——医生需从问诊获取病史，开具检查、整合结果，制定治疗方案，再安排入院。每一步都必须根据最新信息动态调整决策。换言之，现有系统大多只能扮演一个孤立角色，无法贯穿整个诊疗流程。

标准的临床诊疗其实是一套闭环决策：医生依托电子健康记录（EHR）不断收集并更新患者信息，开出各类检验和影像检查，在此过程中逐步修正诊断假设，最终执行药物治疗、手术干预或住院管理。关键之处在于，这些决策最终必须转化为电子病历系统中可执行的结构化指令，并通过像FHIR这样的统一标准来完成规范化记录。因此，一个真正能融入医院工作流的医疗AI，不仅需要具备临床推理能力，还必须能持续调用工具、执行操作、动态调整决策——而这正是AI智能体（AI Agent）的核心范式。

过去虽有诸多尝试，试图让医疗AI从"回答问题"转向"采取行动"。例如，AMIE等系统显著提升了医患对话质量，但依然局限于问诊场景，无法调取病历或开立检查；OpenAI联合企业推出的基层医疗辅助工具，虽能嵌入临床工作流，却不具备自主操作权限；还有基于MIMIC-IV数据集的研究，开始模拟完整诊疗流程，但因缺乏与FHIR等通用医疗体系的深度整合，也未覆盖医患沟通、入院用药核对等关键环节。最终，大家的共识是：现有模型仍难以可靠地自主完成复杂病例的管理。

综合来看，医疗AI领域一直存在两大核心空白：第一，缺少一个能原生嵌入现有EHR体系、真正实现端到端诊疗闭环的自主智能体；第二，尚未有研究系统验证过AI在沟通、诊断、治疗、入院分流等完整临床链路上的综合表现与安全边界。因此，医疗AI面临的真正挑战，从来不是能否答对医学问题，而是能否在真实的医院工作流中持续采取有效行动。

二、全新诊疗体系：

MIRA让医疗AI首次获得"行动能力"

与那些仅能输出文字建议的传统医疗大模型不同，MIRA实现了跨越式突破：它不仅具备专业的临床推理能力，更是首个能在标准化的沙盒电子健康记录（EHR）环境中，自主完成一整套可落地诊疗操作的AI智能体。这套体系包含两大核心技术创新，以及一套标准化的仿真评测底座。

Nature: AI医生MIRA首次“全流程上岗

图1｜MIRA工作流程。MIRA是一个自主医疗AI智能体，在EHR沙盒环境中运行。它利用一套工具来模拟临床工作流程：能够开具检查、综合结果、生成诊断和治疗方案，同时通过聊天与一个基于真实病例回顾性记录中现病史（HPI）构建的患者AI智能体进行交互。

为填补前述研究空白，研究团队开发了MIRA自主医疗智能体，并基于MIMIC-IV数据库中500多例急诊真实病例开展了仿真对照试验。试验的病种覆盖了阑尾炎、胰腺炎、肺炎、胰腺癌等8类常见急诊疾病。

创新1：沙盒隔离EHR运行环境，打通院内系统数据互通

以往绝大多数医疗AI只能输出自然语言建议，难以真正接入医院电子病历。MIRA搭建了一个独立隔离的沙盒电子病历运行环境，全面兼容FHIR交互协议，以及ICD、LOINC、SNOMED-CT等六大国际通用医疗编码体系。它生成的所有诊疗指令均为标准化、结构化的数据，能够无缝适配任何同样遵循统一标准的院内信息系统。这突破了传统医疗大模型"只能建议、无法执行"的最大局限。

创新2：多工具联动闭环决策，复刻医师分步诊疗逻辑

MIRA内置了11类临床工具，覆盖超过85,000种可执行的临床操作。该智能体能自主梳理完整病史、开立并解读各类检查、推导鉴别诊断、开具处方、预约手术、规划入院。与传统模型那种单次碎片化的答题不同，这套多工具联动机制让AI能够模仿真实医生，逐步收集信息、动态调整方案，最终形成一条首尾贯通的完整诊疗链路。

配套仿真交互底座：保障全部试验结论客观可信

为尽可能模拟真实问诊场景、避免试验失真，研究还构建了一个专门的患者仿真智能体。该系统的所有回答均严格受真实现病史（HPI）约束，避免模型提前获取患者最终诊断信息，从而降低因后验信息泄露导致的性能高估风险。

大模型的测试数据表明，这套仿真交互系统非常稳定：无论问题如何改写，回答内容的一致性以及与原始病历的匹配度均超过99%。即便面对诱导泄露诊断信息的对抗性提问，患者智能体也不会提前泄露最终诊断结论，为后续的人机对照实验提供了可信、可复现的评测环境。

严谨的人机对照试验设计

研究设置了两组独立的人类医师对照组：4名持证专科医师作为高水准参照组，6名混合资历的团队来复刻全球常见的德国急诊人力模式（没有专职急诊医师，多由轮转的低年资医生接诊）。两组医师和MIRA使用完全相同的患者信息输入，从诊断、治疗、用药安全三个维度横向对比综合诊疗水平。这样一来，研究结果便具备了很强的现实参考价值和外部有效性。

三、全链路诊疗能力验证：

四大环节证明MIRA实现医师级完整临床决策

过去的大多数医疗AI，顶多能完成问诊、诊断、开药、手术建议中的某一个环节，无法连贯地走完整套诊疗流程。而在本研究中，研究团队围绕临床决策链的四个核心环节——诊断、检查、治疗和安全，系统评估了MIRA的综合表现。结果明确：MIRA不仅能像医生一样连续处理急诊病例，还首次在统一的实验条件下证明，自主医疗智能体具备完成端到端临床决策的能力。

Nature: AI医生MIRA首次“全流程上岗

图2 MIRA的推理轨迹。展示MIRA在每种目标诊断下的决策路径，均以"病史"起始、以"入院"结束。粗黑线为最常见的工具转换路径，边线数字为转换频次；整体流程与人类医生的诊疗顺序高度吻合。自循环箭头表示同一工具的重复调用（如初始影像不可用时改选其他模态）。

环节1：初诊诊断——AI判病准确度整体优于临床医师

评估MIRA的诊断能力，以MIMIC-IV数据库中的出院确诊结果为参考标准。MIRA在八类疾病上的平均诊断准确率达到88.9%。在进一步的人机对照实验中，MIRA在完全相同的信息条件下取得了87.8%的平均诊断准确率，显著高于持证医师的78.1%和基层轮转医师的71.1%。其中，对胰腺炎和阑尾炎的识别优势最为突出；仅胰腺癌的诊断水平与专科医师持平。而像肺炎、尿路感染这类容易混淆的病症，其识别表现也不弱于人类医师。

Nature: AI医生MIRA首次“全流程上岗

图3：a.左图显示基于MIMIC-IV真实数据（n=574）的总体准确率，MIRA对阑尾炎等明确疾病表现优异（148例漏诊2例）；右图为匹配子集（n=311）中MIRA与医师的对比，MIRA准确率显著更高（双侧McNemar检验，P=0.000287），误差线为95%置信区间。b.以阑尾炎为例展示从病史到入院的推理轨迹，粗箭头为主要转换路径，数字为转换次数，循环为重复调用工具。c.检查选择方面，左图为相对MIMIC-IV基线（100%，n=574）的对比，右图为与医师（n=311）的对比。体格检查以柱状图显示检出比例（误差线为95%置信区间）；微生物、血液及影像检查以点图显示召回率（含中位数、四分位距及须线）。显著性经McNemar检验和Wilcoxon检验评估，多重比较经Holm和Benjamini-Hochberg法校正。

环节2：检查规划——AI遵循循证逻辑，严控高价影像检查

进一步分析MIRA的决策轨迹可以发现，其开具检查的顺序与真实临床工作流高度一致，整体遵循由无创检查逐步过渡到有创干预的诊疗逻辑。相比人类医师，MIRA的体格检查覆盖更全面，血液检验指标也更丰富。值得注意的是，虽然MIRA增加了一部分低成本常规化验项目，但它并未表现出通过大量开单来换取更高诊断准确率的倾向。研究未发现它过度使用CT、MRI等高成本影像检查的现象。这说明自主医疗智能体，至少在这一实验中，未表现出明显的过度医疗风险。此外，MIRA在患者居家长期用药核对这一任务中，准确率也相当高，能够快速完成药物信息的结构化整理。

环节3：治疗干预——手术、处方决策更贴合临床规范

在治疗决策环节，研究重点评估了MIRA推荐的手术和药物方案与真实临床实践之间的匹配程度。结果清晰：MIRA的整体治疗方案与标准临床路径的贴合度显著高于人类医师。例如，在阑尾炎病例中，MIRA对腹腔镜阑尾切除术的推荐匹配率达到了100%。总体来看，其在外科操作推荐方面的召回率明显高于医师群体。在药物处方层面，MIRA的整体诊疗规范依从性比医师高出了35个百分点，尤其在补液、镇痛这类标准化治疗场景中表现突出。

当然，MIRA并非完美无缺。与人类医师类似，其抗生素处方仍未达到完全符合指南的水平。这也说明，即使自主医疗智能体的能力不错，在一些关键的治疗决策上，仍需要保留人工复核的机制。

环节4：用药与分流安全——未发现系统性高危医疗风险

医疗AI最终要落地，安全始终是底线。为此，研究团队从药物相互作用、肾功能剂量调整、药物过敏、QT间期延长风险、阿片类药物管控、入院分流等多个维度，对MIRA展开了系统性的安全评估。

结果显示，在56份完整病例中，未观察到任何高危用药错误，近500条处方信息的准确率接近满分。在入院决策方面，MIRA对肺炎、肺栓塞这类高风险患者未出现漏收治的情况，仅对少量肺栓塞病例表现出偏保守的收治倾向。此外，研究还进一步测试了性别差异、患者焦虑情绪以及语言障碍等潜在偏倚因素对模型表现的影响。结果显示，在不同干扰条件下，MIRA的诊断性能波动非常小，整体表现出很好的鲁棒性和稳定性。

四、落地思考与行业展望：

人机协同新模式，配套监管体系缺一不可

这项研究最重要的意义，并不只是让医疗AI的诊断准确率再次提高。它首次证明了一件事：AI不再只能单纯输出文字答疑，而是开始具备在医院工作流中持续采取行动的能力。依托沙盒电子病历搭建的MIRA，能够独立走完急诊从问诊、判病、开检查，到开药、安排入院的完整诊疗链条。在诊断、治疗、用药安全等多个方面，其表现整体优于一线医护人员，补上了过去所有医疗大模型"只会答题、没法在医院里动手操作"这块关键短板。而且，MIRA主打的是病历内的全流程自动化，如果与像AMIE这种擅长实时检索最新医学文献的工具搭配使用，两者可以相互补充，进一步缩小AI决策与临床标准之间的差距。

不过，即便试验数据亮眼，MIRA距离真正的临床应用仍有相当长的路要走。首先，整套仿真交互场景全部依托历史病历的文字搭建，而在现实中，患者说话含糊、信息前后矛盾、遗漏关键病史的复杂情况，仿真环境根本无法完全复刻。其次，训练所用的MIMIC-IV数据集，有可能已经流入了大模型的训练素材，因此试验测出的效果可能存在一定虚高。最关键的是，MIRA全程仅在隔离的沙盒环境中运行，从未对接过医院的真实业务系统，真实的病房中那些复杂和突发状况，它尚未经受检验。

此外，当AI被赋予自主开立检查、生成处方，甚至安排手术和住院的能力时，医疗系统将面临一系列全新问题。从短期应用来看，自主医疗智能体更适合作为医师的协同助手，而非独立诊疗的主体。药物核对、检验套餐组合、会诊文书撰写这类标准化、重复性的任务，可能会成为最先落地的应用场景，从而帮助临床医生减轻繁重的文书负担。

不得不提的是，MIRA在资源使用上表现出较强的克制性。研究未发现它通过大量增加CT、MRI或手术等高成本项目来提升诊断准确率，主要增加的只是低成本常规血液检查。这意味着自主医疗智能体在这一实验中，未表现出明显的过度医疗倾向。未来，如果能进一步引入成本约束和资源优化模块，这类系统甚至可能成为医院优化资源配置的新工具。

长远来看，自主医疗AI的规模化落地，真正的挑战已不再是模型能力本身，而是责任划分和治理体系的建设。首先，人机边界必须被清晰界定：AI可以承担标准化、重复性的诊疗流程，但所有关键决策——包括最终诊断、用药方案、手术安排——都应保留医师强制复核的环节，不应允许智能体独立做出最终医疗决策。

其次，风险管控体系需要与技术能力同步演进。针对高危药物、高价值影像检查等关键环节，医院需要建立人工复核、全流程审计和异常预警机制，确保AI的每一次诊疗行为都能被记录、追踪和解释。与此同时，行业层面也需要逐步建立统一的准入规范、数据安全标准和应急处置机制，为自主医疗智能体进入临床提供制度保障。

归根结底，当医疗AI开始从"知识工具"演变为"行动主体"时，医疗系统需要重新回答一个老问题：谁授权AI行动，谁监督AI行动，又由谁为AI的行动负责。只有当人机分工、风险监管和行业标准同步成熟，自主医疗智能体才有可能真正走出实验室，成为缓解医疗资源紧张、缩小区域医疗差距的重要力量。

参考文献

[1] Ferber, D., Hilgers, L., Höper, C., et al. Towards autonomous medical artificial intelligence agents. Nature (2026). DOI: 10.1038/s41586-026-10675-5.