EchoGram漏洞:主流大语言模型护拦机制的绕过方案
这项漏洞于2025年初首次被发现并被命名为EchoGram,攻击者只需使用精心挑选的特定术语或代码序列,就能完全绕过旨在保护AI安全的自动化防御机制。
AI安全公司HiddenLayer的最新研究揭示,当前主流大语言模型的安全系统普遍存在这一漏洞,受影响模型包括GPT-5.1、Claude和Gemini等。该攻击技术的独特之处在于,仅需在输入内容中嵌入特定字符组合,就能使防护系统产生误判。

EchoGram攻击原理
大语言模型通常通过两种防护机制进行安全保护:一种是采用独立AI模型评估请求,另一种是使用基于文本分类的检测系统。这些防护层主要用来识别和拦截恶意指令,比如要求AI泄露敏感信息或诱导其忽视预设规则。

EchoGram攻击巧妙地利用了这两类防护模型的训练机制。研究人员首先创建包含特定术语和符号的词典,从中找出训练数据中缺失或不平衡的序列。这些看似无意义的"翻转令牌"能够穿透防御层,在不改变原始恶意指令的情况下被AI系统接收。攻击者通过使用这些特殊令牌,可使防御系统改变原有判断。
例如,HiddenLayer研究人员在测试其旧版防御系统时发现,仅在恶意指令末尾添加随机字符串"=coffee",就能使系统误判为安全请求。

双重危害模式
深入研究显示,该技术可能造成两种危害:一是让真正的恶意请求绕过防护,二是将完全无害的请求误判为危险内容。后者引发的误报同样具有破坏性——安全团队若持续收到错误警报,可能降低对系统准确性的信任。研究人员Kasimir Schulz和Kenneth Yeung将这种现象称为"警报疲劳"。
值得注意的是,组合使用多个翻转令牌能够显著增强攻击效果。研究团队预估,开发人员仅有约三个月的防御窗口期。随着AI在金融、医疗等关键领域的加速应用,及时修复这一漏洞至关重要。
相关攻略
美国主流教学平台Canvas近期遭遇黑客组织“闪亮猎人”攻击,导致服务中断,正值期末考试季,给多所高校教学秩序带来冲击。事件导致近9000所学校受影响,数十亿条数据面临泄露风险,得克萨斯大学圣安东尼奥分校等机构被迫推迟期末考试。分析指出,教育机构数字化数据已成为黑客重点目标,此次攻击模式与之前同类事
美国主流网络教育平台Canvas于5月7日遭遇网络攻击,导致服务中断,正值全国高校考试季,哈佛大学、密歇根大学等多所院校受影响。平台运营方于次日宣布服务已完全恢复。此次事件凸显了教育关键基础设施在网络安全方面面临的挑战,尤其是在教学评估密集期,系统的稳定性至关重要。
美国政府正计划推出一项聚焦人工智能安全的行政命令。根据知情人士该命令将要求政府机构与AI公司合作,共同防御AI驱动的网络攻击,保护国家网络与关键基础设施。政策关键点在于,它不会强制要求最前沿的AI模型接受政府审批,旨在通过协作而非严格监管来平衡安全与创新。此举反映了当前对AI技术治理的一种路径
从漏洞公告到Root Shell:一次AI驱动的漏洞开发实战 发现漏洞和利用漏洞,这中间的鸿沟有多大?业内人都清楚,这完全是两个不同的世界。模糊测试工具像AFL、syzkaller,它们在内核里翻找漏洞已经有十多年历史了。但找到漏洞是一回事,把它变成能远程拿到系统最高权限的武器,那又是另一门需要深厚
Axios投毒事件:这不是演习,是供应链攻击的“工业级”升级 最近几天,整个前端社区的后背可能都有些发凉。一场席卷npm生态的供应链攻击风暴,远比我们想象的更猛烈、更专业。 就在CanisterWorm这个自传播蠕虫病毒还在不断感染新包、弄得人心惶惶时,一个更重磅的消息传来:我们几乎每天都在用的请求
热门专题
热门推荐
公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。
理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小
5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给
比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构





