王小川回应张文宏：年轻医生善用AI如何提升诊疗能力

时间：2026-01-23 10:43

王小川“卷”起来了。1月22日，继1月13日开源新一代医疗大模型Baichuan-M3仅仅9天，百川智能再度发布一款名为Baichuan-M3 Plus的模型。据悉，该模型凭借严肃医疗场景下的问答准

王小川“卷”起来了。1月22日，继1月13日开源新一代医疗大模型Baichuan-M3仅仅9天，百川智能再度发布一款名为Baichuan-M3 Plus的模型。据悉，该模型凭借严肃医疗场景下的问答准确性、可靠性，再次刷新了此前刚推出的M3所创下的世界纪录。百川智能创始人、CEO王小川称，“我们也会不断加快后续的迭代速度。”另外百川智能还推出“海纳百川”计划，“将全球最低幻觉的循证增强医疗大模型以API形式免费开放给中国医疗服务机构”。此前，国家传染病医学中心(上海)主任张文宏曾表达了“拒绝将AI引入其所在医院电子病历系统”、担忧年轻医生过度依赖AI未来难以具备鉴别AI诊断正误的能力。针对该观点，王小川在现场也做了回应，目前AI发展非常迅猛，部分场景下AI+医生已经明显优于单个医生，小医生+AI就跟大医生一样了，这是符合医学科学规律的。

免费开放给中国医疗服务机构

根据百川智能给出的数据，目前最新发布的M3 Plus的事实性幻觉降低到新的SOTA，仅2.6%，相较GPT-5.2大幅下降超30%。即便与行业标杆Open Evidence相比，M3 Plus也完成了超越。

谈及海纳百川计划的推出，王小川表示，希望所有为医务工作者提供服务的机构，不管是技术公司还是服务公司都会免费提供API。“我们希望开发更多的场景让医生使用更加顺畅，培养医生怎么使用，最后给患者的服务带来更大的好处，真正成为中国人健康的长期福祉。给医生、药剂师、医剂师、护士提供服务，包括临床服务和决策教育，让大家免费使用这些资源。海纳百川计划现在已经上线，价格下降70%，还有十五天的免费试用。（我们想）为这些机构（开放）长期免费，为这个行业做一些变革性的事情。”

王小川还分享称，如果API免费开放，中国现在有500万的医学工作者，如果全部临床医生都使用一年的成本大概是1亿左右。但这种成本在王小川看来是可接受的，他认为“带来的行业变化会非常大。”

在循证医学体系中，真正决定医生是否信任一条结论的，是该结论背后的证据是否权威、是否准确、是否可追溯。在当前行业中，无论是通用大模型还是医疗模型，大多已在结论后标注论文或指南来源。但在实际使用中，医生往往会发现：点开引文，依然无法判断 AI 的这句结论究竟源自哪一段证据。更常见的是存在信息“张冠李戴”或“冲突”。

百川智能模型技术负责人鞠强在现场提到，比如，当前市面上有些医疗AI似模似样，让大家一看就会觉得是非常可信的状态，但其实有90%的信息都是错误的，没有什么经验的医生或普通人看到这种文献时会认为，“看起来很专业，画像也很专业，似模似样但专业带来的风险其实是更大的”。

为解决上述难题，百川M3 Plus首创“证据锚定（Evidence Anchoring）”技术，不是简单标注“引用自哪篇文献”，而是要求模型生成的每一句医学结论，都必须精确对应到原始论文或指南中的具体证据段落。据悉，目前M3 Plus结论与证据段落的匹配准确率已超过95%。

回应张文宏观点：部分场景应用优于单个医生

此前，国家传染病医学中心(上海)主任张文宏针对人工智能在医疗领域的应用发表了审慎的看法。

对于“医疗与AI”的议题，王小川提到自己也有一些想法。王小川认为，医生和患者都认可患者利益优先的原则，目前AI发展非常迅猛，部分场景下AI+医生已经明显优于单个医生，小医生+AI就跟大医生一样了，这是符合医学科学规律的。“要是因为担心阻碍医生成长而限制使用AI，可能就限制了最有利于病人的医疗措施。要是AI能够实质性帮助患者，就不应该拒绝使用，换句话说，医生的成长不能以当下的患者作为成本。”

另外，王小川还提到，AI使用方法也有很大的提升空间。“不是AI本身，而是AI用法需要探索，如何用好AI是重要课题。要是担心医生能力退化，是否可以换一种用法？年轻医生上岗不是要求医生给AI纠错，而是倒过来，可以让AI对于医生临床思维进行提醒，也给诊疗结果进行校验，这样才有机会降低误诊、漏诊和风险。不是医生给AI挑错，而是AI给医生保驾护航。在这种情况下医生成长了，患者也受益了。”

王小川直接回应了张文宏的观点，表示“针对张文宏的观点，我们认为从理念到实操有些可取的地方可以一起商量”。他提到，今天医疗行业拥抱AI比较敏感，DeepSeek刚出现的时候，大家都害怕得要死。但今天可以看到各个医院医生都号称自己在造医疗垂直模型，但医生的工作不是造模型，而是用模型，这是两个行业。

“OpenEvidence也不是医生造的，美国45%的医生在用这种产品，我们还总是听说模型不好用，所以得把分工做好，医生是很好的用户群体。我们也不要想当然地批评AI，之前就在讲AI没有医生思维，就是一个统计结果，去年年初DeepSeek的发布就开始打脸了，因为打开了思维链，能够像医生一样思考，甚至比医生思考得更加仔细和全面。”王小川提到。

他还表示，现在有些人在讲AI不能思考、共情，但去年有一篇论文拿GPT和医生做对比，结果GPT的共情率是45%，医生的共情率是4.6%。“也有人说患者不能用，医生是能够提问的，我们百川的模型就可以提问，而且比医生问得更加仔细，达到了比医生更高的水平，有些人在讲模型是高幻觉，我们的模型可以做得很低，医生也会有自己的幻觉，我们已经到了2.6版本，很多场景的幻觉都比医生更低。大家应该保持更多的期待，现在很多医生也会不断改变观点，甚至会说不要评价，AI发展太快了，今天说了明天就被打脸。”

王小川呼吁，今天有些问题不只是技术问题，症结也在于大家的思考和共创的能力。“现在医学院也有很大的变化，都要学习八年，八年之后的AI会是什么样子？光靠医生在里面努力显然是不够的，甚至计算机行业写代码也是拥抱变化非常严重。前年我就在讲程序员是自己的掘墓人，写个程序把自己取代了，但说得严重了，今天资深的程序员挺好的，确实可以驾驭AI，活出第二春，相比原效率提升10倍，但年轻的程序员可能第一天就没有AI强，所以计算机和教育都有很多变化。”

采写：南都N视频记者林文琪

来源：https://www.163.com/dy/article/KJTNT73K05129QAF.html