首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
百川智能发布新一代医疗大模型 幻觉率降至33

百川智能发布新一代医疗大模型 幻觉率降至33

热心网友
58
转载
2026-05-27

最近,清华大学百川楼的一场“AI医疗新范式”论坛,把行业的目光再次聚焦。百川智能的创始人王小川在会上,展示了他们即将发布的新一代医疗大模型Baichuan-M4,以及基于此的AI家庭医生产品“百小医”。


在王小川看来,医疗场景对大模型提出了近乎苛刻的刚性要求,可以总结为三个关键点。

第一,低幻觉。医疗领域容不得半点虚构,一个错误的判断可能直接关系到生命安全。这并非危言耸听,《BMJ Open》2026年的一项研究系统评估了主流通用大模型的医疗回答,结果显示,约50%的回答被评定为“有问题”,其中近20%更是属于“高度有问题”。这个水平的幻觉率,在严肃的医疗决策场景下,显然是无法接受的。

第二,强循证。真正的临床诊断遵循严格的循证医学路径,绝不是“根据症状猜一个最可能的病”那么简单。通用模型目前普遍缺乏这种系统性的、层层递进的推理能力。《JAMA Network Open》2026年的一项评测很能说明问题:在29个标准化临床案例中,21款主流大模型在鉴别诊断阶段的错误率普遍超过80%。它们的通病是,不按照临床指南的逻辑进行逐步排除,而是过早地锁定一个答案。

第三,会提问。任何受过专业训练的医生都知道,诊断始于有效的问诊,而不是在患者说完第一句话后就匆忙下结论。牛津大学2026年发表在《Nature Medicine》上的研究揭示了一个关键差距:AI在阅读标准化、结构完整的病历时,准确率可以达到94.9%;但当面对真实患者自助描述时,准确率骤降至34.5%。核心原因在于,患者的初始描述往往是不完整、不准确的,而通用模型不具备像医生那样主动、精准追问的能力。

可以说,这三条刚需,当前的通用大模型一条都没能完全达标。正是为了攻克这些难题,百川智能在其M系列医疗专用大模型上进行了针对性的深度优化。

根据公开信息,新一代的Baichuan-M4模型在HealthBench、HealthBench Hard、HealthBench Professional这三大权威医疗评测榜单中,同时取得了世界第一的成绩,超越了包括GPT-5.5、Opus 4.7、DeepSeek-V4-Pro在内的多个顶尖模型。其背后依托的,是一项原创的“事实性感知强化学习”算法。正是这项技术,将裸模型的事实性幻觉率控制在了惊人的3.3%。


百小医

而基于Baichuan-M4能力打造的AI家庭医生“百小医”,则展现了将技术落地的具体形态。它的产品核心定位非常清晰:“明明白白看医生,安安心心管家人”。

这款产品将深度融入微信生态。其设计思路是,在自然的对话交互中,系统能够持续捕捉并结构化记录每个家庭成员的身体状态、用药历史以及检查数据。更重要的是,它能够从日常的健康闲聊中识别出潜在的高危信号,并主动提醒用户复诊、用药等关键健康行为,试图扮演一个24小时在线的家庭健康守护者角色。

来源:https://ai.cnmo.com/news/809787.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

百川智能发布新一代医疗大模型 幻觉率降至33
AI资讯
百川智能发布新一代医疗大模型 幻觉率降至33

百川智能即将发布新一代医疗大模型Baichuan-M4,其幻觉率降至3 3%,并在多项权威评测中取得领先。该模型针对医疗场景的低幻觉、强循证和会提问三大刚性需求进行深度优化,基于原创算法显著提升事实准确性。同期推出的AI家庭医生“百小医”依托该模型,旨在通过日常交互守护家庭健康。

热心网友
05.27
百川智能发布新一代医疗大模型Baichuan-M4 事实性幻觉率降至3.3%
AI资讯
百川智能发布新一代医疗大模型Baichuan-M4 事实性幻觉率降至3.3%

百川智能即将发布新一代医疗大模型Baichuan-M4及AI家庭医生“百小医”。通过原创算法将模型事实性幻觉率降至3 3%,并在三大权威医疗评测中位列第一。该模型已与多家顶尖医院合作开展临床研究。同时,“百小医”依托微信生态,可为家庭成员建立健康档案,提供日常健康管理与风险预警。

热心网友
05.26
百川智能发布新一代医疗大模型 事实性幻觉率降至3.3%
业界动态
百川智能发布新一代医疗大模型 事实性幻觉率降至3.3%

百川智能发布新一代医疗大模型Baichuan-M4,其事实性幻觉率降至3 3%,在多项权威评测中综合排名世界第一。模型已与国内多家顶尖医院展开临床合作。同时推出的AI家庭医生“百小医”将嵌入微信生态,通过建立家庭健康档案和主动健康管理,缓解优质医疗资源分布不均问题,推动技术向实际服务落地。

热心网友
05.26
千问百川零一万物大模型综合能力对比评测
AI资讯
千问百川零一万物大模型综合能力对比评测

通义千问在通用测试与生态应用上优势显著;百川智能深耕医疗垂直领域,但通用能力稍弱;零一万物侧重轻量化部署,其基础模型与多模态能力尚需更多验证。三者分别展现了通用领先、垂直深入与轻量部署的不同发展路径。

热心网友
05.26
海螺AI与百川智能核心优势对比分析
AI资讯
海螺AI与百川智能核心优势对比分析

选择国产AI助手时,海螺AI和百川智能常被拿来比较。简单来说,海螺AI强在语音实时互动与声音克隆,带来更拟人的体验;百川智能则胜在多轮搜索、反向提问及其Baichuan4模型的高精度推理能力。一个更侧重C端的沉浸感,另一个则偏向B端的系统集成。 如果你正在两者间犹豫,不妨从以下几个核心维度来具体看看

热心网友
05.24

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI数据挖掘核心技术解析与实战应用指南
AI教程
AI数据挖掘核心技术解析与实战应用指南

AI数据挖掘能从海量数据中提炼关键洞察。其核心技术包括:聚类分析将相似数据自动分组以发现模式;分类算法基于历史数据预测新数据类别;关联规则学习揭示数据项间的共生关系;回归分析则量化变量间影响并预测数值趋势。掌握这些方法对决策至关重要。

热心网友
05.27
成都启用全国首个机器人配送社区外卖无需进楼
业界动态
成都启用全国首个机器人配送社区外卖无需进楼

外卖配送的“最后100米”难题,在成都一处青年公寓社区找到了创新解决方案。全国首个实现配送机器人常态化运营的住宅区,近日于成都正式落地。 社区内的配送任务由10台名为“享递Ultra”的机器人承担,它们来自成都高新区的一家科技企业。自今年1月启动试运行以来,这些机器人已累计完成近3万单配送任务,平均

热心网友
05.27
Stable Diffusion图片信息本地解析教程 保护隐私安全提取提示词
AI教程
Stable Diffusion图片信息本地解析教程 保护隐私安全提取提示词

Stable Diffusion 法术解析工具:本地读取AI绘画生成信息的专业解决方案 在利用Stable Diffusion进行AI绘画创作或学习时,你是否常常面临这样的难题:遇到一张效果出色的SD作品,却无法获知其生成所用的具体“咒语”(Prompt)、模型参数等关键信息?同时,出于对作品版权和

热心网友
05.27
极限竞速地平线6正式发售 获2026年最高游戏评分
游戏资讯
极限竞速地平线6正式发售 获2026年最高游戏评分

赛车游戏爱好者们,重磅喜讯来袭!微软旗下王牌竞速系列最新力作《极限竞速:地平线6》现已全球正式发售,同步登陆PC与Xbox Series X|S平台,并首发即加入XGP游戏库。这款备受期待的开放世界赛车游戏,一经推出便交出了一份堪称完美的答卷。 权威游戏媒体IGN毫不吝啬地给出了满分评价,其评语写道

热心网友
05.27
MOCA币购买指南:安全买入流程与挂单卖出策略
web3.0
MOCA币购买指南:安全买入流程与挂单卖出策略

MocaNetwork作为新兴的Web3社交层项目,其代币MOCA的购买需要谨慎规划。本文梳理了从前期准备到买入、持有及卖出的完整流程,重点介绍了中心化交易所直接购买、通过跨链桥转移资产以及使用去中心化交易所挂单等几种主流方式,并分析了不同卖出策略的适用场景,旨在帮助参与者更稳健地操作。

热心网友
05.27