王小川回应张文宏:年轻医生善用AI如何提升诊疗能力
王小川“卷”起来了。1月22日,继1月13日开源新一代医疗大模型Baichuan-M3仅仅9天,百川智能再度发布一款名为Baichuan-M3 Plus的模型。据悉,该模型凭借严肃医疗场景下的问答准确性、可靠性,再次刷新了此前刚推出的M3所创下的世界纪录。百川智能创始人、CEO王小川称,“我们也会不断加快后续的迭代速度。”另外百川智能还推出“海纳百川”计划,“将全球最低幻觉的循证增强医疗大模型以API形式免费开放给中国医疗服务机构”。 此前,国家传染病医学中心(上海)主任张文宏曾表达了“拒绝将AI引入其所在医院电子病历系统”、担忧年轻医生过度依赖AI未来难以具备鉴别AI诊断正误的能力。针对该观点,王小川在现场也做了回应,目前AI发展非常迅猛,部分场景下AI+医生已经明显优于单个医生,小医生+AI就跟大医生一样了,这是符合医学科学规律的。

免费开放给中国医疗服务机构
根据百川智能给出的数据,目前最新发布的M3 Plus的事实性幻觉降低到新的SOTA,仅2.6%,相较GPT-5.2大幅下降超30%。即便与行业标杆Open Evidence相比,M3 Plus也完成了超越。
谈及海纳百川计划的推出,王小川表示,希望所有为医务工作者提供服务的机构,不管是技术公司还是服务公司都会免费提供API。“我们希望开发更多的场景让医生使用更加顺畅,培养医生怎么使用,最后给患者的服务带来更大的好处,真正成为中国人健康的长期福祉。给医生、药剂师、医剂师、护士提供服务,包括临床服务和决策教育,让大家免费使用这些资源。海纳百川计划现在已经上线,价格下降70%,还有十五天的免费试用。(我们想)为这些机构(开放)长期免费,为这个行业做一些变革性的事情。”
王小川还分享称,如果API免费开放,中国现在有500万的医学工作者,如果全部临床医生都使用一年的成本大概是1亿左右。但这种成本在王小川看来是可接受的,他认为“带来的行业变化会非常大。”
在循证医学体系中,真正决定医生是否信任一条结论的,是该结论背后的证据是否权威、是否准确、是否可追溯。在当前行业中,无论是通用大模型还是医疗模型,大多已在结论后标注论文或指南来源。但在实际使用中,医生往往会发现:点开引文,依然无法判断 AI 的这句结论究竟源自哪一段证据。更常见的是存在信息“张冠李戴”或“冲突”。
百川智能模型技术负责人鞠强在现场提到,比如,当前市面上有些医疗AI似模似样,让大家一看就会觉得是非常可信的状态,但其实有90%的信息都是错误的,没有什么经验的医生或普通人看到这种文献时会认为,“看起来很专业,画像也很专业,似模似样但专业带来的风险其实是更大的”。
为解决上述难题,百川M3 Plus首创“证据锚定(Evidence Anchoring)”技术,不是简单标注“引用自哪篇文献”,而是要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。据悉,目前M3 Plus结论与证据段落的匹配准确率已超过95%。
回应张文宏观点:部分场景应用优于单个医生
此前,国家传染病医学中心(上海)主任张文宏针对人工智能在医疗领域的应用发表了审慎的看法。
对于“医疗与AI”的议题,王小川提到自己也有一些想法。王小川认为,医生和患者都认可患者利益优先的原则,目前AI发展非常迅猛,部分场景下AI+医生已经明显优于单个医生,小医生+AI就跟大医生一样了,这是符合医学科学规律的。“要是因为担心阻碍医生成长而限制使用AI,可能就限制了最有利于病人的医疗措施。要是AI能够实质性帮助患者,就不应该拒绝使用,换句话说,医生的成长不能以当下的患者作为成本。”
另外,王小川还提到,AI使用方法也有很大的提升空间。“不是AI本身,而是AI用法需要探索,如何用好AI是重要课题。要是担心医生能力退化,是否可以换一种用法?年轻医生上岗不是要求医生给AI纠错,而是倒过来,可以让AI对于医生临床思维进行提醒,也给诊疗结果进行校验,这样才有机会降低误诊、漏诊和风险。不是医生给AI挑错,而是AI给医生保驾护航。在这种情况下医生成长了,患者也受益了。”
王小川直接回应了张文宏的观点,表示“针对张文宏的观点,我们认为从理念到实操有些可取的地方可以一起商量”。他提到,今天医疗行业拥抱AI比较敏感,DeepSeek刚出现的时候,大家都害怕得要死。但今天可以看到各个医院医生都号称自己在造医疗垂直模型,但医生的工作不是造模型,而是用模型,这是两个行业。
“OpenEvidence也不是医生造的,美国45%的医生在用这种产品,我们还总是听说模型不好用,所以得把分工做好,医生是很好的用户群体。我们也不要想当然地批评AI,之前就在讲AI没有医生思维,就是一个统计结果,去年年初DeepSeek的发布就开始打脸了,因为打开了思维链,能够像医生一样思考,甚至比医生思考得更加仔细和全面。”王小川提到。
他还表示,现在有些人在讲AI不能思考、共情,但去年有一篇论文拿GPT和医生做对比,结果GPT的共情率是45%,医生的共情率是4.6%。“也有人说患者不能用,医生是能够提问的,我们百川的模型就可以提问,而且比医生问得更加仔细,达到了比医生更高的水平,有些人在讲模型是高幻觉,我们的模型可以做得很低,医生也会有自己的幻觉,我们已经到了2.6版本,很多场景的幻觉都比医生更低。大家应该保持更多的期待,现在很多医生也会不断改变观点,甚至会说不要评价,AI发展太快了,今天说了明天就被打脸。”
王小川呼吁,今天有些问题不只是技术问题,症结也在于大家的思考和共创的能力。“现在医学院也有很大的变化,都要学习八年,八年之后的AI会是什么样子?光靠医生在里面努力显然是不够的,甚至计算机行业写代码也是拥抱变化非常严重。前年我就在讲程序员是自己的掘墓人,写个程序把自己取代了,但说得严重了,今天资深的程序员挺好的,确实可以驾驭AI,活出第二春,相比原效率提升10倍,但年轻的程序员可能第一天就没有AI强,所以计算机和教育都有很多变化。”
采写:南都N视频记者 林文琪
相关攻略
数据显示,中国近年氦气消费量持续增长,根据《我国氦气提取技术及市场发展分析》,中国氦气消费量从2015年的1614万立方米,增长到2024年的2570万立方米,复合增速达5 3%,未来几年看需求驱动
文 | 超前实验室2026年开年,大模型领域的资本棋局,落子声陡然密集。近日,向来低调的阶跃星辰被曝正在筹备赴港IPO,计划募资约5亿美元。更引人注目的是,就在一个月前,这家公司刚刚完成了超50亿元
撰文| 吴坤谚编辑| 吴先之在商业史上,有一类公司并不是靠正面击败巨头成长的,而是刻意避开主航道,在被忽视的支流中建立自己的航运体系。亚马逊绕开线下渠道,从线上书籍这种狭窄品类切入以避开沃尔玛等实体
文|长三角MOMO当一家大模型公司不再执着于登顶榜单,却还能持续抬高估值时,真正值得追问的,已经不是它的模型能力,而是它是否正在接近一种基础设施位置。Kimi,可能正走在这条更慢、也更危险的路上。K
虽然AI医疗这条路确实艰苦,但王小川本人似乎更轻松了。作者|刘杨楠编辑|王博“重整旗鼓,建立连接。”在1月13日下午的媒体沟通会上,谈及为何要在新模型发布之际和媒体进行一次深入交流时,百川智能创始人
热门专题
热门推荐
在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过
你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整
如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏
当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围
当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓





