行业上限被拔高！夸克官宣：首个通过主任医师评测的大模型来了

时间：2025-12-18 14:43

7月23日，夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测，成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后，夸克健康大模型的又一次能力跃升。目前，“主任级AI医生”

7月23日，夸克健康大模型成功完成中国12个核心学科的主任医师笔试评估，成为国内首个达此成就的大模型。自5月通过副主任医师职称考试后，夸克健康大模型再次实现能力跨越。目前，“主任级AI医生”功能已全面融入夸克的AI搜索服务，当您查询健康问题时，只需选择深度搜索即可启用该功能。

作为垂类大模型，其优势显而易见。一方面，相比通用型模型，垂类模型在特定场景中具有更强的专业表现。夸克公布的数据显示，在医疗领域答题准确率方面，夸克健康大模型整体超越了通用大模型DeepSeek。这不是说通用模型能力不足，而是应了“术业有专攻”的道理——专注于单一场景的垂直模型显然更符合专业需求。

另一方面，面对专业领域，AI大模型需要处理各种各样的问题，这意味着单纯依赖数据库给出回答是不可靠的，医疗领域尤其如此。举例来说，同样是感冒患者，但症状表现各有不同，严重程度也因人而异，甚至可能伴随并发症或受过敏等因素影响，医生必须依据具体症状描述给出个性化治疗方案。

因此，垂类大模型不仅要“知识渊博”，更要“具备思考能力”。夸克健康大模型基于通义千问，成功走出了一条面向垂直场景的工程化路径。夸克算法负责人表示：“我们在做的不是训练AI回答医学问题，而是训练它学会医学思维。”换句话说，医学垂类大模型不是AI“闭门造车”的产物，而是需要与真实医生共同协作、不断优化。

夸克健康大模型的一个核心突破在于其“慢思考”能力。这项能力结合了链式推理与多阶段临床演绎路径建模，使模型在面对复杂医疗问题时，能够分步骤、逐层深入地推演出最终结论。

所谓“医学思维”并非仅靠知识库或推理能力就能实现。夸克健康大模型的思考建立在高质量训练数据之上。为此，夸克设计了“双数据产线+双奖励机制”的工程体系，将医学数据分为“可验证”与“不可验证”两类，分别对应诊断任务和健康咨询任务。此外，在训练方法上，夸克引入了“过程奖励模型”和“结果奖励模型”，以同时保证推理过程和最终结论的合理与准确。

为避免AI模型陷入应试型答题模式，夸克健康大模型还采用了多阶段强化学习流程。通过医生真实标注、以“提问—思考—回答”整体数据驱动强化学习，夸克健康大模型真正做到了“活学活用”，具备了真实的医学思维能力。

凭借医学领域的专业表现，夸克健康大模型赢得了不少医师的认可。例如，安贞医院心脏外科主任医师谢进生指出，夸克在某些问题的回答中展现出了比专业医师更高的专业水平。同时，夸克AI搜索吸引了大量医学生和医生用户，当前平台在全国医学生中的月活跃用户数已超过200万，覆盖超过一半的医学生群体，这充分证明了夸克健康大模型在医学领域的权威性。

此次突破标志着夸克健康大模型达到新的能力高度，但这并不是AI大模型的终点。医学大模型不仅要在专业层面持续优化，在应用层面更应致力于让普通用户享受到“人均拥有专业医师”级的咨询服务体验。

来源：https://www.leikeji.com/article/70738

夸克健康大模型医学 AI AI医疗

上一篇iPhone 17系列4款机型所有颜色齐亮相：橙色最抢眼 下一篇各自价位最好的两款游戏CPU！AMD 7800X3D、9950X3D降至历史低价

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争，正步入一个全新的发展阶段。近日，宇树科技正式发布了其WVLA2 0具身大模型，并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号：当前这场竞赛的核心壁垒，或许已不再是谁拥有更大的模型参数，而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间，将精灵G2机器人直接部署到真实的平板量产质检产线，并全程公开直播后，交出的最具说服力的答案。让我们关注这场直播的硬核数据：连续64小时不间断作业，产线累计完成17625件产品检测，机器人累计执行64828次操作，任务成功率精确达到

科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后，仅过了一周时间，这款全新纯电SUV便驶入中国专业赛道场景——这一次，地点换成了永久性专业赛道。回顾2026年北京车展，保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后，志愿填报这场“第二次大考”随即全面开启。对众多家庭而言，这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多，每一步都如履薄冰。教育部近日发布预警，严厉批评那些漫天要价的“志愿规划师”，直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜，网上信息真假混杂，不同机构给出的

科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来，伴随新能源汽车产业的爆发式增长，早期投入使用的动力电池正迎来集中退役高峰，锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂，正从地下矿藏逐渐转向我们身边的“城市矿山”，从“一次性使用”的线性消耗模式，迈向“循环再生”的可持