研究：ChatGPT、Gemini等主流AI半数给出错误医疗建议

时间：2026-04-22 15:51

当AI成为“家庭医生”：一次令人警醒的医疗咨询测试最近，一项针对全球主流生成式AI工具的测试，给火热的AI医疗咨询泼了一盆“冷水”。测试发现，包括OpenAI的ChatGPT、谷歌的Gemini在内的多款头部AI聊天机器人，在面对普通人常见的健康咨询时，给出的回答有一半以上都不准确，甚至存在明显的

当AI成为“家庭医生”：一次令人警醒的医疗咨询测试

最近，一项针对全球主流生成式AI工具的测试，给火热的AI医疗咨询泼了一盆“冷水”。测试发现，包括OpenAI的ChatGPT、谷歌的Gemini在内的多款头部AI聊天机器人，在面对普通人常见的健康咨询时，给出的回答有一半以上都不准确，甚至存在明显的误导性。这无疑给AI在医疗领域的应用前景，蒙上了一层现实的阴影。

测试结果：安全风险不容忽视

测试团队精心准备了上百个普通人最常在网上搜索的健康问题，从慢性病的日常管理到突发不适的应急处理，几乎覆盖了所有大众咨询场景。结果呢？

数据显示，只有不到一半的AI回复称得上符合专业临床规范。更令人担忧的是，在错误的回复中，超过三成都存在明确的安全隐患。比如，有的会写错处方药的剂量，有的完全忽略了药物过敏的禁忌，甚至还有的会推荐早已被现代医学淘汰的旧疗法。这些错误可不是简单的信息偏差，它们完全有可能对咨询者的健康造成直接威胁。

热潮背后：通用AI的医疗“软肋”

这几年，大语言模型的能力突飞猛进，向AI咨询健康问题，已经成了不少人的新习惯。头疼脑热，先问问AI，似乎比跑一趟医院更方便。但问题恰恰出在这里。

目前市面上绝大多数面向普通用户的通用AI聊天机器人，它们的“知识”主要来自互联网上的公开信息。这些数据既没有经过专业医疗机构的审核把关，其产品本身也并未获得任何医疗服务的资质。说白了，它们提供的健康信息，本质上和你在网上随意搜索到的内容，属于同一类别——缺乏权威性和可靠性保障。

行业反思：医疗容不得“差不多”

这次测试的结果，其实给整个行业提了个醒：医疗领域的容错率，几乎是所有应用场景中最低的。用衡量通用大模型的标准来要求医疗AI，显然行不通。一个语法错误无伤大雅，但一个用药建议的错误，后果可能不堪设想。

当然，头部AI厂商已经意识到了这个问题，开始与专业医疗机构联手，共同开发垂直领域的医疗大模型。不过，这条路走起来并不轻松。高质量的专业标注数据从何而来？不同地区的医疗审核标准如何统一？这些都是横在面前的现实挑战。

给普通用户的最终建议

那么，作为普通用户，我们该如何看待AI的健康建议呢？答案很明确：仅作参考，绝不替代。

当前阶段，通用AI提供的医疗回复，其价值更像是一本可以交互的“健康百科”，它能提供一些基础的信息梳理，但绝对无法替代专业医生的诊断和治疗。身体出现任何问题，最稳妥、最安全的方式，依然是及时寻求正规的医疗帮助。毕竟，在健康这件事上，依赖一个可能出错的“黑箱”模型，风险实在太大了。

来源：https://cxgn.cn/12730.html

ChatGPT

上一篇硅谷华人AI创企Creao AI获千万美元融资累计超3000万美元 下一篇MAI-Image-2-Efficient – 微软推出的轻量版文生图模型

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-01

诺基亚TA-1619入网：1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息，一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可，不过证件照目前还没公布。从入网信息来看，这是一款TD-LTE数字移动电话机，支持TD-LTE网络，属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持，终端款式为直板。核心配置方面，电池额定容

业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片，采用直接变频架构，覆盖10MHz至7250MHz频段，支持最大450MHz带宽及JESD204B高速接口，性能对标国际，满足5G基站与卫星通信等高端需求，突破海外技术壁垒。

业界动态 · 2026-07-01

月起私人充电桩可卖电每度净赚5毛

近期有一则重大利好消息，值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起，湖北武汉的新能源车主，可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言，就是借助峰谷电价差，实现低买高卖，每度电净收益约5毛钱。过去，车网互动（V2G）基本只局限于特定的公共充电站，受试点规模限制，

业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息：谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息，Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发，实际上它的技术代号是Gemini 3 1 Flash Lite Image，属于Gemini 3 1家族。最大的卖点就两个：快，便

业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行，来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴，以主板、显示器等专业硬件保障比赛稳定流畅，并通过赛事反哺研发的闭环模式支持电竞发展。