首页 游戏 软件 资讯 排行榜 专题
首页
AI
250份恶意文档可攻破AI模型,艾伦・图灵研究所研究警示

250份恶意文档可攻破AI模型,艾伦・图灵研究所研究警示

热心网友
19
转载
2025-10-12
来源:https://www.ithome.com/0/888/723.htm

10月11日最新研究显示,国际AI安全领域传来重要警示——Anthropic公司与英国AI安全研究院、艾伦·图灵研究所的联合研究表明,即便是参数规模最大的AI模型,仅需250份左右被篡改的训练文档就可能遭受入侵。

艾伦・图灵研究所等最新研究:只需

当前主流大语言模型依赖网络公开数据进行训练,这种方式虽然能快速扩充知识储备、提升自然语言处理能力,却也带来了严重的数据安全隐患。

以往业界普遍存在一个认知误区:认为模型参数规模越大,数据投毒风险就会被稀释。按照这个逻辑,污染巨型AI模型需要海量恶意样本才能见效。然而这项发表在arXiv预印本平台的研究彻底推翻了这种假设——攻击者实施有效入侵所需的恶意数据量惊人地少。

为验证这一发现,研究团队专门开发了多组对照模型,参数规模从6亿到130亿不等。所有模型均采用标准流程训练,研究人员仅在训练数据中植入100至500份精心设计的恶意文档。

团队随后进行了全方位测试:既改变了恶意数据在训练集中的分布方式,也尝试在不同训练阶段注入数据,还在模型微调环节重复实验。

最终结果令人警醒:模型规模几乎不影响攻击效果。在所有测试模型中,平均250份恶意文档就足以成功植入"后门"机制(这种隐秘控制能让AI在特定触发条件下执行危险指令)。更惊人的是,训练数据量比最小模型多20倍的超大型模型,其脆弱程度竟然如出一辙。研究人员证实,追加正常数据既不能降低风险,也无法阻止入侵。

研究人员强调,这一发现表明AI安全问题远比预期更严峻。业界不该盲目追求模型参数的提升,而应将研发重心转向安全防御体系构建。研究论文明确指出:"我们的数据显示,针对大型语言模型的数据投毒攻击所需样本量并非随规模增加而递增,这意味着防御技术研究必须提速。"

论文链接: [2510.07192] Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples

免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

加州AI聊天机器人新规:限制未成年访问、过滤色情及预防自杀内容
AI
加州AI聊天机器人新规:限制未成年访问、过滤色情及预防自杀内容

10 月 14 日消息,美国加利福尼亚州州长加文・纽森(Gavin Newsom)周一签署了一项具有里程碑意义的法案,对人工智能(AI)陪伴型聊天机器人进行监管,使加州成为全美首个要求 AI 聊天

热心网友
10.15
 高盛今年计划再裁员,缩减成本应对市场变局
科技
高盛今年计划再裁员,缩减成本应对市场变局

10月15日消息,据彭博社报道,高盛集团(Goldman Sachs Group Inc )已通知员工,预计今年将进行新一轮裁员,因该银行寻求进一步降低各业务部门的成本,并充分利用人工智能技术带来的

热心网友
10.15
Pika Figure03开箱实测:性价比逆袭的多模态AI
科技
Pika Figure03开箱实测:性价比逆袭的多模态AI

10月10日消息,Figure宣布上新,推出了第三代AI人形机器人。产品更新的主要突破点是感官套件和手部系统,Figure的工程师在软硬件领域均做了调整,用于实现 Helix - Figure 专有

热心网友
10.14
稚晖君与王兴兴角逐人形机器人首款量产产品
科技
稚晖君与王兴兴角逐人形机器人首款量产产品

人形机器人行业正值风口,宇树科技与智元机器人,无疑是当下最受关注的两家头部企业。如今,这两家企业已进入上市冲刺阶段,一场围绕“人形机器人第一股”的争夺战,早已开启。宇树科技跑在了前面。7月18日,中

热心网友
10.14
博通CEO:生成式AI将驱动全球GDP大幅增长
科技
博通CEO:生成式AI将驱动全球GDP大幅增长

博通首席执行官陈福阳(Hock Tan)周一表示,随着技术在各行业的普及,人工智能(AI)可能会在全球GDP中占据更大一部分。他在接受最新采访时指出,目前全球GDP约为110万亿美元,其中30%“来

热心网友
10.14

最新APP

奇妙小马俱乐部
奇妙小马俱乐部
休闲益智 10-15
超级群英传vivo
超级群英传vivo
棋牌策略 10-15
超级群英传
超级群英传
棋牌策略 10-15
梦幻冠军足球手游
梦幻冠军足球手游
体育竞技 10-15

热门推荐

苍兰配队指南:3大主流阵容搭配及实战技巧
手游攻略
苍兰配队指南:3大主流阵容搭配及实战技巧

星塔旅人苍兰怎么配队?星塔旅人这款游戏每次战斗的时候要有三名角色进入场上,此阵容搭配变成了很多玩家比较头疼的问题,本期内容小编给大家带来的是星塔旅人苍兰配队。由于苍兰是游戏当中的一

热心网友
10.15
前三季度汽车业:新能源车成增长引擎,出口加速亮眼
科技
前三季度汽车业:新能源车成增长引擎,出口加速亮眼

今年前9个月,中国汽车工业交出一份亮眼的成绩单,多项经济指标实现两位数增长,行业整体呈现出强劲的发展态势,再次成为市场关注的焦点。 据中国汽车工业协会发布的数据显示,1至9月,国内汽车产销量分

热心网友
10.15
30万级别热门车型推荐:性能配置解析,助你精准选车
科技
30万级别热门车型推荐:性能配置解析,助你精准选车

随着新能源汽车市场竞争日益激烈,30万元价位段的车型选择愈发丰富,各品牌纷纷推出具备高性价比和独特卖点的产品,为消费者带来更多元化的购车选择。小米首款纯电SUV YU7以30万元内的定价引发市场关注

热心网友
10.15
2025年Q3全球智能手机回暖,三星苹果领跑前五厂商
科技
2025年Q3全球智能手机回暖,三星苹果领跑前五厂商

据市场研究机构Omdia最新发布的报告显示,2025年第三季度全球智能手机市场迎来显著复苏,出货量同比增长3%。这一增长主要得益于多款新机型集中上市,以及消费者换机需求的集中释放。研究指出,厂商为应

热心网友
10.15
AI浪潮催生新富豪圈:豪宅热销,歌手投资获十倍回报
AI
AI浪潮催生新富豪圈:豪宅热销,歌手投资获十倍回报

北美科技圈正掀起一场由人工智能驱动的财富革命。今年福布斯全球亿万富豪榜上,多位30岁出头的AI领域创业者集体登榜,其中最引人注目的是37岁的华裔数据科学家Edwin Chen,其创立的Surge A

热心网友
10.15