研究警示：五大AI平台半数医学建议存疑，使用需谨慎

首页

热心网友

转载

2026-05-19

慎用AI，研究称五大头部AI平台50%医学建议“有问题”

当身体出现不适，你的第一反应是打开搜索引擎，还是问问AI？一项最新的研究结果，或许能给这股“AI问诊”的热潮泼上一盆理性的冷水。

北京时间4月15日，彭博社报道指出，一项发表于权威医学期刊《BMJ Open》的研究揭示，AI驱动的聊天机器人在提供医学建议时，大约有一半的概率会给出“有问题”的答案。这无疑为这项正快速渗透我们日常生活的技术，敲响了关于健康风险的警钟。

研究如何进行的？

来自美国、加拿大和英国的研究团队，将目光投向了当前最主流的五大AI平台：ChatGPT、Gemini、Meta AI、Grok以及DeepSeek。他们的评估方法直接而系统：在五个不同的健康类别下，向每个平台提出10个问题，然后对答案进行专业评判。

结果令人深思。在所有收集到的回答中，约有50%被认定为“有问题”，而其中近20%更是被划为“高度有问题”的范畴。这意味着，当你向这些AI咨询健康问题时，拿到不准确或不完整建议的可能性，并非小概率事件。

慎用AI，研究称五大头部AI平台50%医学建议“有问题”

（图示：黄色代表“有问题”的回答，橙色代表“高度有问题”的回答）

AI的“偏科”与“自信”

进一步分析发现，这些AI的表现存在明显的“偏科”现象。在面对诸如疫苗有效性、癌症筛查建议等封闭式、事实性较强的问题时，它们的回答相对更可靠。然而，一旦问题转向开放式咨询，或者涉及干细胞疗法、营养学等复杂且前沿的领域，AI的表现就开始大幅下滑，错误率和误导性显著增加。

更值得警惕的是研究指出的另一个共性：这些AI在给出回答时，往往带着一种“自信而确定”的口吻。但仔细审视就会发现，没有一个聊天机器人能在回答任何问题时，提供完整且准确的参考文献列表来支撑其观点。换句话说，它们说得“很肯定”，但依据却“不透明”。在整个研究过程中，仅有Meta AI出现过两次拒绝回答的情况，其他平台几乎是有问必答，无论其知识边界是否覆盖。

热潮背后的隐忧

这项研究之所以重要，是因为它精准地戳中了一个现实矛盾：公众对AI健康咨询的需求正在爆炸式增长，但这些平台本身，既未获得提供医学建议的执业许可，也缺乏人类医生所具备的临床判断与情境化分析能力。

数据显示，仅OpenAI的ChatGPT，每周就有超过2亿人咨询健康和保健问题。巨大的需求也催生了市场的快速跟进，今年1月，OpenAI宣布将推出面向普通用户和临床医生的健康工具，Anthropic公司也为其Claude产品规划了新的医疗保健服务。

然而，研究的作者们明确指出，如果在缺乏充分公众教育和有效监管的情况下匆忙部署这些健康聊天机器人，一个巨大的风险在于——它们可能成为错误信息的“放大器”。那些听起来权威、实则存在缺陷的回答，一旦被广泛传播和采信，后果不堪设想。

研究结论呼吁，必须重新评估AI聊天机器人在面向公众的健康沟通中的角色与部署方式。技术的进步带来了便利，但在关乎生命的医疗健康领域，审慎与验证永远应该排在盲目信任之前。毕竟，当健康遇到问题时，一个负责任的答案，远比一个快速却存疑的答案重要得多。

来源:https://tech.ifeng.com/c/8sKwBIZdX0Y

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：清华阿里通义智能体新方案实现长程任务成本降低70% 下一篇：OpenClaw爆火背后12类安全漏洞 MCP协议安全基准深度解析

相关攻略

2026年Hermes Agent功能详解与应用场景全指南

HermesAgent是一款开源自主AI智能体框架，定位为可持久运行、自我进化的“数字员工”。它以任务完成为导向，通过四层架构处理信息、操作文件、执行终端命令及自动化浏览器，支持六种部署方式，并通过统一网关接入微信等多平台。其关键特性在于能从任务经验中自动提炼并复用技能，实现持续进化，越用越。

热心网友

05.18

具身智能两大世界第一揭秘行业巨头探寻其真实身份

近期，世界模型领域动态频频，竞争日趋白热化。李飞飞教授创立的具身智能公司 World Labs 高调发布了「Spark 2 0」模型；几乎同时，阿里巴巴也推出了自家的世界模型「快乐生蚝」。此外，Physical Intelligence 公司发布了新模型 π 0 7，重点强调了其在未见任务上的组合

热心网友

05.18

豆包机器人亮相马拉松引热议抽象设计被调侃全身是腿

近日，2026北京亦庄机器人半程马拉松赛事现场，一款造型独特的机器人意外成为焦点，在网络上引发了广泛讨论。这款被网友昵称为“豆脚”的机器人，以其极具辨识度的外观和有趣的行走姿态，迅速走红。 “豆脚”机器人的创意来源于抖音平台的虚拟IP“豆包”。其创作者、抖音博主“同济子豪兄”基于高擎动力的小派机器人

热心网友

05.18

对话王潜：一个月后机器人将进入家庭接单服务

“跑马拉松的机器人和我们，完全是两个领域。我们和做语言模型的公司，距离反而更近。” 就在不久前，一场机器人马拉松吸引了无数目光。那些拥有刀锋般双足的机器人，跑出了超越人类的速度。然而，在自变量科技CEO王潜看来，这更多是硬件能力的展示，而真正的战场，在于“大脑”。 “硬件在中国，从来都不是壁垒。今天

热心网友

05.18