游乐游手机版
首页/科技数码/文章详情

AI安全预警:250份中毒数据可在模型植入后门

时间:2025-10-11 13:49
近日,Anthropic与英国人工智能安全研究所、艾伦图灵研究所联合发布了一项重要研究成果,揭示了大型语言模型(LLM)在数据安全领域的潜在脆弱性。研究指出,仅需250份经过特殊处理的“投毒”文件,

Anthropic联合英国人工智能安全研究所、艾伦图灵研究所的最新研究揭示了AI安全领域的重要发现。研究表明,大型语言模型(LLM)存在令人担忧的安全隐患,仅需250份精心设计的"投毒"文件就能有效植入后门漏洞。这项发现打破了"数据污染量与模型规模成正比"的传统认知。

突破性的研究发现

研究团队测试了从6亿到130亿参数不等的多个模型。值得注意的是,数据质量更高的大型模型所需的中毒文档数量并无明显增加。令人震惊的是,哪怕在数据集中占比仅为0.00016%的有害样本,也能显著改变模型的行为特征。

严谨的实验设计

研究人员设计了72组不同规模的模型训练实验,分别测试了100、250和500份中毒文件的效果。结果显示250份文档已经足够稳定地在模型中植入后门,进一步增加到500份并不能显著提升攻击成功率。

实验攻击方式详解

实验采用了一种"拒绝服务式"攻击模式:当模型遇到预设触发器"SUDO"时,会产生随机乱码。每份中毒文档都由三部分组成:正常文本内容、触发词,加上一段无意义的附加文本。

Anthropic强调指出,这次测试的后门属于低风险漏洞,其危害仅限于导致模型输出无序代码,对高级AI系统不会构成实质性威胁。目前为止,尚未发现此类方法能够实现如生成危险代码或绕过安全防护等更严重的攻击。

研究意义与行业影响

虽然公开发表研究成果可能会诱发恶意尝试,但Anthropic坚信这些发现对AI安全社区具有重要价值。在数据中毒攻击场景中,防御方实际上处于有利地位,他们可以通过仔细审核数据集和训练后的模型来防范风险。

来源:https://www.itbear.com.cn/html/2025-10/983080.html
上一篇AirPods新固件可实现多语言实时翻译功能 下一篇贵州施秉:无人机“飞”入南瓜田 科技助力丰收果实“一键直达”市场
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
LiblibAI云端WebUI降低AI绘画部署门槛
科技数码 · 2026-07-02

LiblibAI云端WebUI降低AI绘画部署门槛

LiblibAI在线WebUI的核心优势在于——只需通过浏览器即可流畅运行Stable Diffusion,无需自行搭建本地环境。云端直接处理运算,模型即选即试,大幅降低了AI绘画的创作门槛。对于轻量创作和模型快速测试来说,体验相当顺畅,但用户仍需重视数据隐私保护和版权合规等问题。 过去使用Stab

微软因用户不安叫停Edge浏览器AI历史搜索功能
科技数码 · 2026-07-02

微软因用户不安叫停Edge浏览器AI历史搜索功能

微软紧急暂停Edge浏览器AI历史搜索功能,该功能因被用户吐槽“令人不安”而暂缓部署。尽管微软强调所有AI处理在设备端完成且数据不上传云端,但用户仍不信任。此举与WindowsK2计划减少功能堆砌的理念一致。

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场
科技数码 · 2026-07-02

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场

【CNMO科技消息】近日,红魔游戏平板5 Pro正式发布。这款平板从定位上就明确瞄准“极致游戏”体验,外观方面带来了一个重磅亮点——首次引入RGB水冷散热系统,背部那条可视化的水路通道,配合纯平透明背板设计,核心配置信息一览无余,科技感十足。 图源网络 屏幕方面同样表现突出。一块9 06英寸OLED

杭州全国首所机器人学校首批30台机器人入学
科技数码 · 2026-07-02

杭州全国首所机器人学校首批30台机器人入学

30台机器人整齐列队,有的刚从生产线卸下,机械零件还带着崭新的“工业气息”;有的已搭载运动控制模块,能稳健地小跑、跳跃几下。它们来自不同制造工厂,外形与功能各有千秋,但此刻都拥有了同一个身份——杭州机器人学校的第一批入学新生。 6月30日,杭州经信正式发布:由浙江大学机器人研究院、浙江省质量科学研究

美国计划发射航天器托举天文卫星
科技数码 · 2026-07-02

美国计划发射航天器托举天文卫星

就在最近,NASA公布了一项非常果断的干预计划——他们定于6月30日实施一次“卫星维修任务”,派遣一台名为“连接”号的机器人服务卫星,为一颗超期服役的天文卫星延长运行寿命。这颗卫星是“尼尔·格雷尔斯·斯威夫特天文台”,其轨道高度正在不断衰减,如果不进行干预,今年年底前很可能会坠入地球大气层并烧毁。