7月23日,夸克健康大模型成功完成中国12个核心学科的主任医师笔试评估,成为国内首个达此成就的大模型。自5月通过副主任医师职称考试后,夸克健康大模型再次实现能力跨越。目前,“主任级AI医生”功能已全面融入夸克的AI搜索服务,当您查询健康问题时,只需选择深度搜索即可启用该功能。
作为垂类大模型,其优势显而易见。一方面,相比通用型模型,垂类模型在特定场景中具有更强的专业表现。夸克公布的数据显示,在医疗领域答题准确率方面,夸克健康大模型整体超越了通用大模型DeepSeek。这不是说通用模型能力不足,而是应了“术业有专攻”的道理——专注于单一场景的垂直模型显然更符合专业需求。
另一方面,面对专业领域,AI大模型需要处理各种各样的问题,这意味着单纯依赖数据库给出回答是不可靠的,医疗领域尤其如此。举例来说,同样是感冒患者,但症状表现各有不同,严重程度也因人而异,甚至可能伴随并发症或受过敏等因素影响,医生必须依据具体症状描述给出个性化治疗方案。
因此,垂类大模型不仅要“知识渊博”,更要“具备思考能力”。夸克健康大模型基于通义千问,成功走出了一条面向垂直场景的工程化路径。夸克算法负责人表示:“我们在做的不是训练AI回答医学问题,而是训练它学会医学思维。”换句话说,医学垂类大模型不是AI“闭门造车”的产物,而是需要与真实医生共同协作、不断优化。

夸克健康大模型的一个核心突破在于其“慢思考”能力。这项能力结合了链式推理与多阶段临床演绎路径建模,使模型在面对复杂医疗问题时,能够分步骤、逐层深入地推演出最终结论。
所谓“医学思维”并非仅靠知识库或推理能力就能实现。夸克健康大模型的思考建立在高质量训练数据之上。为此,夸克设计了“双数据产线+双奖励机制”的工程体系,将医学数据分为“可验证”与“不可验证”两类,分别对应诊断任务和健康咨询任务。此外,在训练方法上,夸克引入了“过程奖励模型”和“结果奖励模型”,以同时保证推理过程和最终结论的合理与准确。
为避免AI模型陷入应试型答题模式,夸克健康大模型还采用了多阶段强化学习流程。通过医生真实标注、以“提问—思考—回答”整体数据驱动强化学习,夸克健康大模型真正做到了“活学活用”,具备了真实的医学思维能力。
凭借医学领域的专业表现,夸克健康大模型赢得了不少医师的认可。例如,安贞医院心脏外科主任医师谢进生指出,夸克在某些问题的回答中展现出了比专业医师更高的专业水平。同时,夸克AI搜索吸引了大量医学生和医生用户,当前平台在全国医学生中的月活跃用户数已超过200万,覆盖超过一半的医学生群体,这充分证明了夸克健康大模型在医学领域的权威性。
此次突破标志着夸克健康大模型达到新的能力高度,但这并不是AI大模型的终点。医学大模型不仅要在专业层面持续优化,在应用层面更应致力于让普通用户享受到“人均拥有专业医师”级的咨询服务体验。
