5000亿美元巨头开源最强医疗AI 中国企业助力性能超越谷歌
一家估值超过5000亿美元的加密货币巨头,最近展示了一款在性能上足以挑战谷歌的AI医疗大模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
以发行全球最大稳定币USDT而闻名的Tether,近日推出了名为QVAC MedPsy的AI医疗大模型。多项医学推理与诊断基准测试的结果显示,其性能表现令人瞩目:
这款参数仅1.7B的轻量级模型,竟然击败了规模大16倍的谷歌MedGemma-27B。不仅如此,其4B参数版本在保持较高输出质量的同时,消耗的计算资源(token数)比主流模型少了3.2倍。
这一结果,直接对AI医疗领域长期信奉的“模型规模越大,效果越好”的共识提出了挑战。Tether AI团队在其技术说明中强调,该模型的设计理念更接近于一种“轻量级高密度推理系统”。

开发者社区对此反响积极,许多评论认为这种“低参数、高性能”的组合,或许为医疗大模型的发展指明了一条新的技术路径。
值得注意的是,Tether旗下的AI团队在2024年才启动招募,成立时间并不长。从其官网披露的技术细节和开源链路来看,QVAC MedPsy的训练并非完全从零开始,而是基于多个现有基础模型,进行了组合式的训练与深度优化。

中国大模型的持久统治力
深入追溯其背后的论文与技术报告,一个关键发现浮出水面:在封闭式医学基准测试以及HealthBench评估框架中,Tether团队实际上采用了一家中国公司的开源医疗大模型——百川智能的Baichuan-M3-235B——作为其核心的“教师模型”。
在Tether团队的内部模型筛选中,与Baichuan-M3同台竞技的对手包括OpenAI的GPT-OSS-120B,以及量化投资巨头旗下Ubiquant AI推出的Fleming-R1-32B。
结果显示,Baichuan-M3-235B在几乎所有核心评测指标上都占据了明显优势,尤其是在处理高复杂度医学问题时,其领先幅度更为显著。
其中,最值得关注的当属医学推理基准MedXpertQA。
这个基准被业内公认为难度最高的医学多选评测之一。与基于USMLE题库的传统MedQA不同,MedXpertQA更侧重于复杂的临床推理、多学科诊断以及长链路的决策能力,在某种程度上,它更贴近顶级医院多学科会诊(MDT)的真实场景。
在这一高难度基准上,Baichuan-M3相比其他竞品取得了高达10.98分的领先优势。对于医疗AI而言,这已不仅仅是简单的“精度提升”,它意味着模型在理解复杂病情、组织诊疗逻辑以及调用医学知识的能力上,可能已经产生了代际差异。
此外,在经典的大模型评测MMLU-Pro Health上,Baichuan-M3同样表现突出,分别取得了超过竞争对手5.05分和2.73分的优势。
事实上,早在2026年1月首次发布时,Baichuan-M3就已经在全球权威医疗AI评测基准HealthBench上击败了GPT-5.2,并刷新了当时的最高纪录。更难得的是,在AI模型更新迭代进入“月更时代”的背景下,它所建立的这种优势并未随时间迅速衰减。
具体数据显示,Baichuan-M3-235B相较GPT-OSS-120B领先约6至12分,相较Fleming-R1-32B领先约10至12分,并且在HealthBench的全部七个评估维度上都保持了持续性的优势。

Tether团队对Baichuan-M3模型的评价
这种持续领先的背后,是百川智能在医疗强化学习体系上长期投入的结果。
从2025年的M2模型开始,百川便将原本依赖患者模拟器与静态评分规则的半动态反馈机制,升级为能够随模型能力共同演化的全动态验证器系统。随着监督信号不断变得更为细化和困难,模型得以持续突破自身的能力上限,最终使得M3在复杂医学推理与医疗沟通能力上实现了质的飞跃。
与此同时,M3还首次具备了原生的“端到端”严肃问诊能力。这意味着它可以像真正的医生一样,在对话中主动追问、层层递进地逼近病因,将关键病史和风险信号一步步挖掘出来,然后再基于完整的信息进行深度的医学推理。
这也解释了为何Tether团队并非Baichuan-M系列模型唯一的拥趸。该系列模型在开源社区累计获得了超过150万次下载。得益于百川推出的「海纳百川」计划,M3 Plus API已向服务医务工作者的机构免费开放,目前已有大量团队基于该模型构建各类医疗应用。
甚至在今年3月OpenAI发布GPT-5.4之后,开源社区中仍有不少开发者呼吁,希望看到GPT系列与Baichuan-M3在HealthBench上进行一次正面对决,并质疑GPT在医疗健康领域的真实能力是否已被中国的医疗大模型反超。

正如百川智能创始人兼CEO王小川在媒体采访中所言:“(AI医疗的)护城河核心肯定在于模型能力的绝对领先,在医疗这一严肃领域,只有领先一代的技术水平才能建立行业信任。”
重构专业医疗的“数字基建”
当大模型浪潮席卷各行各业时,真正有能力且决心切入医疗AI核心领域的公司并不多,百川智能算是其中起步最早、路径最清晰的代表之一。
早在2023年成立后,百川智能便迅速跻身国内大模型赛道的前列。到了2025年,公司明确了“为人类造医生、为生命建模型”的核心战略,其后发布的模型几乎全部围绕医疗场景和推理能力增强展开。
同年10月,百川推出了首个循证增强医疗大模型Baichuan-M2Plus,其在控制“幻觉”(即事实性错误)方面的表现明显优于通用大模型,幻觉率降低至同期其他主流模型的三分之一,其回答的可信度已接近资深临床医生的水准。
年底,百川智能发布了医疗智能体平台PAPA。该平台能够实现从用药提醒到动态调整健康计划的全程管理,真正将AI能力嵌入到以月甚至年为周期的患者康复管理临床闭环之中。
随后登场的医疗大模型Baichuan-M3更是取得了突破性进展。它在全球权威医疗评测HealthBench中以65.1分的成绩登顶,首次全面超越GPT-5.2,并同时刷新了医疗幻觉率的最低记录。
进入2026年,医疗健康已成为AI技术最受重视的落地领域之一。OpenAI推出了“个人超级健康助手”ChatGPT Health,谷歌发布了最新的开源医疗模型MedGemma 1.5,Anthropic也拿出了Claude for Healthcare来抢占医疗市场。
与通用大模型“先做能力、再找场景”的常见路径不同,百川智能选择深耕医疗垂直领域,紧紧围绕临床真实需求打磨产品,持续在低幻觉率、端到端问诊和复杂临床推理等核心能力上寻求突破。
例如,其构建的“深度问诊”能力,让模型能够在有限的对话轮次中,将临床诊断所需的关键问题问全、问准,其表现甚至显著超过了设定的人类医生基线水平。
而首创的“证据锚定”技术,不仅为模型的医学结论提供引文来源,更能将每一句结论精确映射到原始医学论文的对应段落。这使得AI的医学判断变得可核验、可追责、可教学,极大地增强了其在临床环境中的可信度。
正是这些扎实的技术积累,让百川智能在医疗AI行业进入深水区后,逐渐形成了独特的差异化优势——不仅拥有强大的底层模型能力,更对医院的工作流程有深刻理解,其产品也更贴近真实的临床场景。
在政策支持、医院数智化转型与大模型技术突破的多重动力推动下,医疗AI正在步入真正的产业化周期。而已经提前完成垂直领域深耕、初步建立起技术与场景闭环的百川智能,显然占据了更为有利的竞争位置。
据行业信息显示,百川智能即将发布新的AI医疗应用产品与新一代大模型,其实际应用表现与后续技术成果,值得保持高度关注。
相关攻略
AI购物助手能通过自然语言描述或上传图片推荐家具和搭配方案,并提供AI试穿预览效果。它还可根据人生阶段定制采购清单,通过语音交互分析空间痛点,给出改进建议,从而降低决策成本,提升购物体验。
千问AI购物助手能通过搜索或拍照,实时抓取多平台商品价格、促销及评价信息,自动生成可视化比价结果。用户还可设置价格追踪,当商品达到预设价位时,系统会主动推送提醒并附带购买链接,帮助消费者高效省钱。
借助豆包AI构建高质量需求文档,需遵循结构化路径:明确指令与背景,搭建完整框架;分模块校验逻辑,通过反推失败场景暴露漏洞;嵌入业务规则,明确数据契约;将复杂流程转化为带角色与判定节点的可视化脚本;最后生成验收测试用例,确保需求可验证。五步环环相扣,能有效提升文档质量与。
2026年2月,一项由斯坦福大学、莫斯科国立大学等顶尖机构联合发布的研究,给当前火热的人工智能“读心术”领域泼了一盆冷水。论文直指一个核心问题:我们寄予厚望、用来解码AI大脑的“X光机”——稀疏自编码器(Sparse Autoencoders, SAE),其有效性可能远低于我们的想象。 理解大型语言
谷歌安全团队近期披露了一起具有里程碑意义的网络攻击事件:一个网络犯罪组织利用人工智能技术,成功开发出一款能够自动探测并试图利用某款主流系统管理软件中未知安全漏洞的黑客工具。 这起事件的性质远超普通网络攻击。根据谷歌发布的详细报告,这是全球首次有确凿证据证实,人工智能被直接用于生成针对“零日漏洞”的自
热门专题
热门推荐
持续三年的咖啡市场价格竞争,在2026年初迎来了关键转折点,各大品牌集体展现出告别低价策略的趋势。 库迪咖啡已将大部分产品价格调整至11 9元至16 9元区间,部分核心单品的价格上调幅度达到30%至60%;瑞幸咖啡则更早一步,显著收窄了其标志性的9 9元优惠活动的适用范围。行业已形成一个清晰共识:仅
2026年5月13日,全球权威指数编制机构MSCI(明晟公司)正式发布了其季度指数审议结果。此次调整备受资本市场瞩目,所有变更将于5月29日收盘后正式生效。 在本次MSCI指数季度调整中,MSCI中国指数的成分股变动成为市场焦点。根据最新公告,该指数新增了22家中国上市公司,涵盖光库科技、长飞光纤、
在汽车制造业的可持续发展浪潮中,一场源自中国广西柳州的绿色材料革命正备受瞩目。上汽通用五菱成功构建了以本土竹资源为核心的汽车零部件创新产业链,通过前沿科技将这一可再生材料转化为高性能汽车部件,为全球汽车产业的低碳转型探索出一条独具特色的中国路径。 这一产业链的核心价值,在于其显著降低了对石油基塑料的
对于经常驾驶电动汽车进行长途出行的车主而言,高速续航焦虑、服务区充电排队、途中电量不足等问题,都是真实存在的困扰。这曾是许多新能源车主在跨城出行时最担心的情况。然而,通过多次长途实测的经验总结与策略优化,一套能够显著提升电车长途旅行安心度与便利性的实用方法已经得到验证。 车载电器:容易被忽视的“耗电
本文解答了抹茶MEXC新用户在注册过程中最常遇到的五个问题,涵盖账户注册、身份验证、审核时长、安全设置以及后续操作。内容旨在帮助用户清晰了解流程,顺利完成从开户到交易的全部步骤,确保账户安全与合规使用。





