游乐游手机版
首页/科技数码/文章详情

行业上限被拔高!夸克官宣:首个通过主任医师评测的大模型来了

时间:2025-12-18 14:43
7月23日,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后,夸克健康大模型的又一次能力跃升。目前,“主任级AI医生”

7月23日,夸克健康大模型成功完成中国12个核心学科的主任医师笔试评估,成为国内首个达此成就的大模型。自5月通过副主任医师职称考试后,夸克健康大模型再次实现能力跨越。目前,“主任级AI医生”功能已全面融入夸克的AI搜索服务,当您查询健康问题时,只需选择深度搜索即可启用该功能。

作为垂类大模型,其优势显而易见。一方面,相比通用型模型,垂类模型在特定场景中具有更强的专业表现。夸克公布的数据显示,在医疗领域答题准确率方面,夸克健康大模型整体超越了通用大模型DeepSeek。这不是说通用模型能力不足,而是应了“术业有专攻”的道理——专注于单一场景的垂直模型显然更符合专业需求。

另一方面,面对专业领域,AI大模型需要处理各种各样的问题,这意味着单纯依赖数据库给出回答是不可靠的,医疗领域尤其如此。举例来说,同样是感冒患者,但症状表现各有不同,严重程度也因人而异,甚至可能伴随并发症或受过敏等因素影响,医生必须依据具体症状描述给出个性化治疗方案。

因此,垂类大模型不仅要“知识渊博”,更要“具备思考能力”。夸克健康大模型基于通义千问,成功走出了一条面向垂直场景的工程化路径。夸克算法负责人表示:“我们在做的不是训练AI回答医学问题,而是训练它学会医学思维。”换句话说,医学垂类大模型不是AI“闭门造车”的产物,而是需要与真实医生共同协作、不断优化。

57429e357267b0de99405e935d1d59b5.webp

夸克健康大模型的一个核心突破在于其“慢思考”能力。这项能力结合了链式推理与多阶段临床演绎路径建模,使模型在面对复杂医疗问题时,能够分步骤、逐层深入地推演出最终结论。

所谓“医学思维”并非仅靠知识库或推理能力就能实现。夸克健康大模型的思考建立在高质量训练数据之上。为此,夸克设计了“双数据产线+双奖励机制”的工程体系,将医学数据分为“可验证”与“不可验证”两类,分别对应诊断任务和健康咨询任务。此外,在训练方法上,夸克引入了“过程奖励模型”和“结果奖励模型”,以同时保证推理过程和最终结论的合理与准确。

为避免AI模型陷入应试型答题模式,夸克健康大模型还采用了多阶段强化学习流程。通过医生真实标注、以“提问—思考—回答”整体数据驱动强化学习,夸克健康大模型真正做到了“活学活用”,具备了真实的医学思维能力。

凭借医学领域的专业表现,夸克健康大模型赢得了不少医师的认可。例如,安贞医院心脏外科主任医师谢进生指出,夸克在某些问题的回答中展现出了比专业医师更高的专业水平。同时,夸克AI搜索吸引了大量医学生和医生用户,当前平台在全国医学生中的月活跃用户数已超过200万,覆盖超过一半的医学生群体,这充分证明了夸克健康大模型在医学领域的权威性。

此次突破标志着夸克健康大模型达到新的能力高度,但这并不是AI大模型的终点。医学大模型不仅要在专业层面持续优化,在应用层面更应致力于让普通用户享受到“人均拥有专业医师”级的咨询服务体验。

来源:https://www.leikeji.com/article/70738
上一篇iPhone 17系列4款机型所有颜色齐亮相:橙色最抢眼 下一篇各自价位最好的两款游戏CPU!AMD 7800X3D、9950X3D降至历史低价
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持