游乐游手机版
首页/科技数码/文章详情

百川智能首发证据锚定技术,推出M3 Plus模型

时间:2026-01-22 18:49
百川智能正式发布全新一代医疗大模型——Baichuan-M3 Plus,该模型为目前全球幻觉率最低的循证增强型医疗大模型。最新披露,M3 Plus深度融合自主研发的六源循证技术与M

百川智能正式推出全新一代医疗大模型——Baichuan-M3 Plus,该模型是目前全球幻觉概率最低的循证增强型医疗大模型。

最新披露显示,M3 Plus深度融合了自主研发的六源循证技术与M3基座架构,将事实性幻觉率大幅压低至2.6%,显著优于Open Evidence,刷新全球最低纪录;同时首发“证据锚定”机制,不仅能提供规范化的文献引用,更可将模型生成的每一句医学结论,精准定位至原始文献中的具体证据段落,真正实现AI医学输出的可验证、可追溯、可教学。

权威测评数据表明:M3系列在Healthbench、Healthbench Hard等多项国际主流医疗评测中稳居第一,全面超越GPT-5.2;尤其在业界公认的低幻觉核心指标上实现突破,以3.5%的幻觉率位居全球首位。

首创“证据锚定”技术,百川智能发布 M3 Plus

M3首次引入Fact-Aware RL强化学习范式,使基础模型在无需外部工具辅助的前提下,幻觉水平即达到当前最优基准;在此基础之上,M3 Plus进一步将已在M2 Plus中充分验证的六源循证框架,深度嵌入模型训练与推理全流程,确保每一条临床建议均具备坚实的专业医学证据支撑。最终,M3 Plus的事实性幻觉率再创新低,仅为2.6%,较GPT-5.2下降超30%,并一举超越行业标杆Open Evidence。

此外,依托MoE架构升级、模型量化压缩及Gated Eagle-3投机解码等关键技术优化,M3 Plus的API调用成本相比前代模型直降70%。

来源:https://www.php.cn/faq/2018334.html?uid=1246273
上一篇2026年算力市场展望:GPU转攻内存,云服务格局重塑与算力泡沫辨析 下一篇Inworld发布TTS-1.5:超低延迟实现,成本节省25倍
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
电动汽车电池新国标7月实施安全门槛升级
科技数码 · 2026-07-01

电动汽车电池新国标7月实施安全门槛升级

近两年来,新能源车自燃事件频频登上热搜,动力电池的安全问题已成为众多消费者购车时最担忧的“心头大石”。即将于2026年7月1日正式实施的强制性国家标准《电动汽车用动力蓄电池安全要求》(GB 38031-2025),无疑为这块“石头”加铸了一道全新的安全屏障。新规的严苛程度究竟如何?行业又是否准备就绪

电动汽车电池新国标7月落地安全门槛再升级
科技数码 · 2026-07-01

电动汽车电池新国标7月落地安全门槛再升级

新华社北京6月29日电 题:电动汽车电池新国标7月落地,安全门槛再升级 动力电池被誉为新能源汽车的“心脏”,其安全性能直接决定了消费者是否敢放心购买、安心驾驶。眼下,一项全新的强制性国家标准即将实施,整个产业都需重新审视自身的产品布局。 强制性国家标准《电动汽车用动力蓄电池安全要求》(GB 3803

作为科技全球首发人形护理机器人 具身智能重塑养老新范式
科技数码 · 2026-07-01

作为科技全球首发人形护理机器人 具身智能重塑养老新范式

我国60岁以上老年人口已突破3 2亿,其中失能和半失能老人超过5000万。与此同时,专业养老护理员的缺口高达千万级别。简而言之,这个行业长期陷入“不可能三角”:人手始终不足、成本持续攀升、长者的尊严难以得到全面保障。在此困境下,融合自主移动躯体与数字交互大脑的具身智能体,被普遍视为破解养老护理难题的

大众汽车正式放弃博世智能驾驶合作项目
科技数码 · 2026-07-01

大众汽车正式放弃博世智能驾驶合作项目

据电动知家等多家媒体报道,6月29日,德国《图片报》等媒体披露,大众汽车正计划终止与博世在自动驾驶领域的合作,此举旨在削减成本、提升市场竞争力。 回顾来看,大众与博世的这场合作始于2024年初。当时,大众旗下软件子公司Cariad与博世正式宣布达成全面战略合作,目标是联合开发驾驶辅助及自动驾驶软件,

朱雀三号火箭顺利完成静态点火试验传捷报
科技数码 · 2026-07-01

朱雀三号火箭顺利完成静态点火试验传捷报

2026年6月29日,朱雀三号重复使用遥二运载火箭在东风商业航天创新试验区圆满完成了静态点火试验。这一消息看似简短,实则蕴含重要进展——它标志着我国可重复使用火箭的工程化进程又向前迈出了坚实的一步。 本次试验的核心目标是全面验证火箭系统、发射场系统及其相互间的匹配性能。各系统运行正常,试验数据与结果