在罕见病临床诊断实践中,医疗专家长期面临两大核心痛点:一是疾病确诊难度高、临床漏诊率居高不下;二是现有辅助诊断工具多呈现“黑箱”特性,决策过程不透明,导致临床信任难以建立。2026年,上海交通大学人工智能学院与医学院附属新华医院联合研发的DeepRare系统,为这一行业难题提供了创新解决方案。作为全球首个专注于罕见病领域的智能体式(Agentic AI)循证推理系统,其核心突破在于模拟人类专家的深度诊断思维,提供可追溯、可解释的“白盒”诊断路径,致力于弥合人工智能技术与临床信任之间的关键鸿沟。
从模式匹配到“中枢-分身”的白盒推理
DeepRare的技术框架,与早期依赖大规模数据模式匹配的医疗人工智能模型存在本质差异。其创新核心在于构建了一套名为“中枢-分身”(Central-Avatar)的协同推理架构。
该架构的首要设计原则是“过程可解释”。系统生成的每一项诊断结论,均附带完整、清晰的证据链。临床医生不仅能获取诊断结果,更能直接审查每一步推理的依据,从根本上解决了传统深度学习模型因“黑盒”决策导致的临床采纳障碍。这类似于资深医学专家进行多学科会诊时,不仅给出诊断意见,同时系统阐述其临床推理与鉴别诊断逻辑。
此外,系统底层知识库并非静态封闭。它实现了与全球权威医学文献数据库及真实世界临床病例库的实时动态链接,突破了单一医疗机构的数据局限。每一次诊断分析的基准,均建立在持续更新的全球医学知识图谱之上,而非依赖局部或过时的临床经验。
动态交互逻辑:引入“慢思考”与假设验证循环
DeepRare的动态运行机制,深度融合了人类认知心理学中的System 2“慢思考”模式。它并非被动的数据处理工具,而是主动的临床思维协同伙伴。
当输入的病例信息存在模糊或关键数据缺失时,系统不会基于不完整信息强行输出可能存误的结论。相反,它会像一位严谨的临床医师那样,主动发起交互式提问,请求补充必要的临床症状、体征或实验室检查结果。这种动态交互机制,确保了诊断推理起点的数据质量与可靠性。
更为关键的是,系统内部运行着一个严谨的假设生成 -> 证据验证 -> 自我反思逻辑闭环。在推理过程中,如果新发现的临床证据与初始诊断假设产生矛盾,智能体会自主启动逻辑修正流程,重新评估诊断路径并排查潜在漏洞。这种持续的自我优化与迭代能力,使其在处理复杂、多步骤的罕见病鉴别诊断时,展现出更强的逻辑鲁棒性与诊断准确性。
核心指标:数据如何驱动诊断精度
任何医疗人工智能技术的临床价值均需通过严谨的实证数据验证。DeepRare的相关研究成果已发表于国际顶级期刊《自然》,其诊断性能受多个关键变量影响,这些数据也清晰界定了其能力范围。
在最具挑战性的诊断场景下——即仅提供患者临床表现与表型信息,未输入任何基因测序数据——系统的首位诊断召回率(Recall@1)仍可达到57.18%。这一数据充分证明了其在临床表型深度解析与疾病关联推理方面的强大能力。
当引入基因测序数据作为关键诊断变量后,系统的综合诊断性能实现显著提升,首位诊断准确率高达70.6%。该表现已超越国际主流罕见病诊断工具Exomiser的基准性能。
除最终诊断结论外,诊断过程的可信度同样至关重要。在系统生成的循证推理报告中,其所引用医学证据的临床相关性准确度达到95.4%,这为临床医生采纳其辅助诊断意见提供了坚实的循证医学支持。
从实验室到临床:部署与访问路径
目前,DeepRare已完成从技术原型到临床及产业应用的关键转化。
在医院端应用场景中,该系统已作为“智能诊断质控助手”在上海交通大学医学院附属新华医院内部署并进入临床内测阶段,深度整合至全院罕见病多学科诊疗流程,承担辅助诊断与医疗质量控制的角色。
面向全球范围的医学研究者与临床专家,DeepRare同时提供了云端SaaS访问平台。专业用户可通过其官方门户进行体验。该平台主要面向持有医疗执业资质或通过机构认证的研究人员,目前已为全球超过600家医疗机构、科研院所及生物医药企业提供技术服务。
其在线诊断分析流程设计符合临床工作习惯:用户登录平台后,可输入包含患者年龄、性别、主诉、现病史在内的真实或模拟病例信息;系统基于初始信息,智能生成针对性追问以完善关键临床细节;在确认所有诊断相关信息后,即可启动智能分析引擎;最终,系统输出结构化的诊断报告,通常包含鉴别诊断建议、潜在治疗方案、相关医学知识库链接及关键变量分析。
总结
DeepRare罕见病诊断智能体,代表了人工智能深度赋能严肃医疗决策的新一代范式。它通过“中枢-分身”协同架构实现了透明可溯的白盒推理,依托假设-验证-反思的动态迭代机制提升了长链条诊断逻辑的可靠性,并能根据临床表型与基因组学数据的多模态输入,提供可量化、可解释的诊断决策支持。它的临床应用,不仅是诊断工具的革新,更是对医疗人工智能如何构建临床信任体系、实现人机智能协同诊疗的一次重要范式探索。
