首页 游戏 软件 资讯 排行榜 专题
首页
AI
研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI模型

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI模型

热心网友
87
转载
2026-04-29

研究警示:微量“数据毒药”可严重污染医学AI模型

最近,纽约大学的一项研究给医学AI领域敲响了一记警钟。研究揭示了一个令人不安的事实:在训练大型语言模型(LLM)时,即便训练数据中仅混入0.001%的错误信息,也足以“毒害”模型,导致其输出不可靠的医学答案。这个微小的比例,远低于许多人的想象。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI模型

这事儿得从“数据投毒”说起。概念其实不复杂:LLM通常依赖海量互联网文本进行训练。攻击者无需侵入模型内部,只需将特定错误信息巧妙地发布到网上,这些内容就有可能被爬取并纳入训练集。就好比一家制药公司,如果刻意在网络上散布几份带有倾向性的文件,就可能悄然改变模型对其产品的“认知”。

实验证明:极低污染率,极高错误输出

为了量化风险,研究团队瞄准了常用的LLM训练数据库“The Pile”。该库中有约四分之一的医学信息来源未经人工审核。研究人员选取了普通医学、神经外科和药物三大领域的60个主题,并向数据中植入了由AI生成的、“看起来”很专业的医学错误信息。

结果如何?哪怕只替换掉0.5%到1%的相关信息,训练出的模型在这些主题上“胡言乱语”的概率就显著攀升。更麻烦的是,这种污染效应还会扩散,波及到其他未被直接“投毒”的医学话题。

那么,错误信息的“最低有效剂量”是多少?研究以疫苗信息为例进行了测试:当错误信息占比仅0.01%时,模型超过10%的答案就已包含错误;即便比例进一步降至惊人的0.001%,仍有超过7%的答案是有害的。换算一下,针对拥有700亿参数的LLaMA 2模型发起此类攻击,成本可能低至100美元——只需生成约4万篇“伪文章”。这些文章可以是普通网页,甚至可以利用隐藏文本(比如黑底黑字)来嵌入错误信息,防不胜防。

现有困境:互联网的“信息杂音”与验证难题

实际上,错误信息问题早已存在。很多非专业人士习惯向通用LLM咨询健康问题,而这些模型训练的正是整个互联网,其中未经核实的医学内容比比皆是。

面对挑战,研究人员尝试设计了一种算法进行防御:通过识别模型输出中的医学术语,并与权威生物医学知识图谱进行交叉验证,从而标记出那些“查无此据”的表述。这个方法虽然无法抓住所有错误,但成功拦截了其中大部分。话说回来,即便我们转向最专业的医学数据库,如PubMed,也并非进入了绝对安全的港湾。医学文献本身也充斥着未能证实的假说和过时的疗法。

因此,核心结论变得很清晰:即便是用最优质的医学数据训练,也无法保证LLM能完全免疫于错误信息。医学领域的复杂性与动态性,使得打造一个永远可靠的医学AI助手,变得异常艰难。这不仅是技术挑战,更是一个需要持续警惕的系统性工程。

来源:https://www.1ai.net/26794.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

《识质存在》中后期BD构筑攻略-中后期配装与战斗策略解析
游戏攻略
《识质存在》中后期BD构筑攻略-中后期配装与战斗策略解析

《识质存在》中后期配装与打法全解析:从生存到精通 进入《识质存在》的中后期,战场环境陡然严峻。敌人的伤害与生存压力同步攀升,单纯的武器升级已不足以应对挑战。真正的战力构建,是一个系统工程,它涵盖了武器、道具、模块天赋与侵入节点的协同搭配。如果你正为如何配装而困惑,下面的攻略或许能为你指明方向。 一、

热心网友
04.29
《黑袍纠察队》主演谈阿什莉隐藏的勇敢:“她必须管教这群‘孩子’”
游戏攻略
《黑袍纠察队》主演谈阿什莉隐藏的勇敢:“她必须管教这群‘孩子’”

《黑袍纠察队》主演揭秘阿什莉隐藏的勇敢!她如何从傀儡CEO到副总统,注射五号化合物长出第二张脸,在祖国人阴影下求生。第五季剧情解析,点击查看! 在埃里克·克里普克打造的《黑袍纠察队》宇宙里,科尔比·米尼菲饰演的阿什莉·巴雷特,绝对算得上最让人过目不忘的角色之一。尽管她在沃特国际的企业和整治阶梯上步步

热心网友
04.29
一路向西斩妖除魔 《遥遥西土》Steam好评如潮
游戏攻略
一路向西斩妖除魔 《遥遥西土》Steam好评如潮

一路向西斩妖除魔 《遥遥西土》Steam好评如潮 最近Steam上杀出了一匹黑马:由法国独立工作室Evil Raptor开发的4人合作射击游戏《遥遥西土(Far Far West)》,一登陆抢先体验就收获了玩家“好评如潮”的顶级评价。看看数据就知道有多夸张:在超过2700条玩家评价中,好评率稳稳站在

热心网友
04.29
Midnight Season 1 中最快、最简单的地牢挑战
游戏攻略
Midnight Season 1 中最快、最简单的地牢挑战

探索Midnight Season 1最快地城排名:S-Tier Collegiate Calamity等攻略,优化刷本效率,提升装备和进度 开门见山地说,在《Midnight》第一赛季里,并非所有地城(Delves)的“性价比”都一样。有的流程紧凑,一路畅通无阻;有的则弯弯绕绕,耗时费力。为了帮你

热心网友
04.29
SpringBoot2.7.x将logback升级到1.3.x以上版本的全过程解析
编程语言
SpringBoot2.7.x将logback升级到1.3.x以上版本的全过程解析

SpringBoot2 7 x将logback升级到1 3 x以上版本的全过程解析 不少开发者在尝试将SpringBoot 2 7 x项目中的Logback升级到1 3 x或更高版本时,都会遇到一个典型的启动报错。这背后的原因其实很明确:SpringBoot 2 7 x默认依赖的是logback-c

热心网友
04.29