游乐游手机版
首页/AI教程/文章详情

OpenAI关于布兰矩阵Abyssal Soul Heist算法安全问题的官方回复说明

时间:2026-06-23 14:50
布兰矩阵团队发现AbyssalSoulHeist安全漏洞,利用会话隔离缺陷实现零点击跨会话数据窃取。OpenAI承认研究价值,但按现行赏金政策将模型层问题排除在外。团队呼吁建立模型与系统联动风险的激励机制及跨界协作治理体系。

在人工智能产业快速落地的当下,算法本身的安全隐患早已不再局限于实验室环境,而是直接渗透到传统网络空间的安全边界。布兰矩阵算法安全团队近期发现并负责任披露了一项名为Abyssal Soul Heist的研究成果,它揭示了一个令人警觉的现实:模型层面的某些设计缺陷,在特定场景下会外溢并放大为系统级甚至网络级的安全风险。

相关研究已提交给对应厂商(OpenAI),并获得了正式回复。借此契机,我们希望推动行业、监管与学界之间形成更高效的协同沟通机制——毕竟,AI时代的用户安全,不能仅靠单点修复。

一、Abyssal Soul Heist安全漏洞详细说明

通过构造特定的自然语言“攻击”载荷,攻击者能够使模型在同一服务中读取并越权访问其他会话的历史内容,进而将这些敏感信息通过外部可控路径传出。本质上,这突破了会话隔离与访问控制机制,导致未经授权的数据访问与跨会话信息泄露。

关键特征与影响:

零点击特征:该漏洞无需任何额外的用户交互或点击,受害者可能在完全不知情的情况下被窃取信息。

格式化渲染被滥用:攻击可以利用富文本、链接等渲染机制,将被窃取的数据隐蔽传输出去,大幅增加检测与防御难度。

受影响范围:所有以会话隔离为设计前提的多会话Web/API环境,尤其是那些将会话历史用作个性化记忆或状态的服务,都属于潜在攻击目标。

潜在后果:窃取跨会话历史聊天记录——其中可能包含敏感信息、API凭证片段、业务数据等,对科研机构、企业以及高度敏感用户而言,这无疑是灾难性的。

安全检测盲区:在当前攻击模式下,许多传统端侧与网络层的检测手段(如常规流量特征检测、沙箱行为分析)难以直接识别或拦截,攻击面被显著放大。

对抗高级威胁:这类漏洞可被APT组织快速利用,在目标用户或组织间实现无感知窃取和定向信息获取。

这个案例清晰展示了“模型功能设计 → 用户体验 → 安全外溢”的风险链条——那些为了提升体验而引入的持久化、个性化功能(例如session/记忆机制),如果没有充分的模型级与系统级防护,就会成为数据泄露的放大器。应对措施必须覆盖从模型输出约束、会话隔离强化、最小权限执行,到端到端审计与应急响应的全链路治理。

二、事件经过与OpenAI回复要点

OpenAI在用户层面推出了session功能,旨在让每个用户拥有一个独立的个性化“贾维斯”,在持续对话和多轮任务中更贴合需求。这个方向本身是合理的——它标志着AI服务从“无记忆的一次性工具”向“伴随式智能助理”的进化。

但恰恰是这种持久化、个性化的会话设计,成了Abyssal Soul Heist攻击链路的构造前提。模型在session中保持状态与跨任务记忆,一旦叠加外部调用,就可能演变为新的攻击面。

在向OpenAI提交研究与责任披露后,厂商书面回复表达了两层意思:一是肯定这是一条“interesting path of research”(有研究价值的路线);二是根据其现行漏洞赏金计划,将“general model issues”(模型层面上的通用安全问题)排除在赏金范围之外,赏金计划只聚焦于“低交互、可复现、绕过特定应用层提示注入防护”的漏洞利用——更接近传统Web/应用层漏洞的情形。

坦率地说,对OpenAI的回复,我们的理解是:厂商在形式上认可了该研究的学术与安全价值,但按既定商业与赏金框架,并不将这类模型层级的问题纳入自动奖励条目。这本身就是一个有价值的信息点:它提示了当前主流漏洞激励机制与模型层风险之间存在结构性不匹配。我们的目标仍是推动行业讨论,促进更广泛的制度性改进。

三、关于OpenAI处置措施与时间线

已确认的信息是:在我们向厂商提交该问题并进行责任披露后,约两个月的时间窗口内,厂商对外报告中所涉及的、可被直接利用的具体点进行了修复或缓解。

对厂商迅速修复具体可滥用点的做法,我们表示肯定——这也印证了负责任披露在降低现实风险中的积极作用。研究复现过程中我们做了完整的录屏保留。

但与此同时,我们也必须指出:技术处置与赏金政策上的分离带来了一个悖论——即便厂商已修复问题,对研究者的制度性回馈(如赏金或正式承认)并未覆盖所有对公众安全具有重要意义的发现。我们尊重厂商现有规则,但也期待未来能建立更包容、更能反映“模型—系统联动风险”价值的协作机制。

四、不为赏金而研究,为全体用户与产业安全而研究

赏金从来不是驱动我们前行的核心动力。真正让我们持续投入研究与披露的,是对“AI算法安全即用户安全、产业安全、社会安全”的深切关注。Abyssal Soul Heist的发现说明:模型层面的偏差或弱点并非孤立存在,而是在与外部系统耦合时可能变成实质性的威胁链条。对此,布兰矩阵团队有三点明确主张:

  • 跨界治理:模型安全必须纳入“模型—系统—运维”全链路治理,而非仅限于模型开发或应用层单点修补。
  • 制度创新:建议建立或扩展漏洞激励机制(如算法漏洞赏金/AI安全赏金),将模型层与系统耦合风险的发现纳入激励与修复流程。
  • 国际与国内协作通道:单靠任何一家厂商都无法独立解决全局性风险,必须搭建企业、学界、安全社区、媒体与监管机构之间的常态化协作机制。

五、请国内监管与行业伙伴关注并参与

我们特别期待国内相关监管与治理主体(如网络安全主管部门)能够:

  • 关注模型层面到网络空间的外溢风险;
  • 把算法安全纳入网络与数据安全的整体监管框架(参考公安部三所发布的榜单,布兰矩阵提供技术支持);
  • 支持产学研协同,推动建立跨界披露与应急响应通道——例如针对AI的RCD(负责任协调披露)机制。(团队已起草RCD-AI草案)

在合规与受控的条件下,团队愿意与监管单位共享必要的技术细节与检测指标,协助风险评估与治理实践。

六、我们对团队贡献的声明与适度的失望

布兰矩阵研究团队为本次发现投入了大量的人力与时间:从威胁建模、受控复现、负责任披露,到跟踪厂商修复进展,每一步都力求专业与谨慎。

我们很高兴看到厂商对可滥用点的修复——这体现了负责任披露的价值。但同时,厂商将“研究价值”的肯定与“赏金激励”分离,使得像我们这样对全局安全有警示价值的工作,在制度上没有获得对等的激励或公开表彰。这种落差确实令人有些失望,但并不会动摇我们继续推动行业进步的决心。

下一步计划:

  • 在不泄露可滥用细节的前提下,发布一份公开白皮书,阐述风险模型、检测指标与高层缓解建议。
  • 向国际安全组织、国内监管与行业社区提交研究摘要,推动“模型→系统外溢”纳入公共安全议程。
  • 与国内监管机构积极对接,探讨建立AI专属的协调披露与应急响应机制。
  • 继续推进学术与工业合作,完善检测工具链与审计能力,并在合适渠道分享指标与无害化测试方法。

七、写在最后

Abyssal Soul Heist只是一个开端——它提醒我们:当现实世界越来越依赖算法驱动决策与自动化执行时,算法自身的安全就是公共安全的重要组成部分。我们不在乎一笔赏金,但我们在乎所有用户在算法时代的安全与尊严。布兰矩阵愿与各界一道,把对话从“单点修复”升级为“制度与协同治理”,共同守护一个更安全、更可靠的AI时代。

来源:https://cloud.tencent.com.cn/developer/article/2695265
上一篇AI安全研读第七期:ACL 2025警惕弹窗攻击视觉语言智能体 下一篇顶会AI安全论文研读第八期:EMNLP 2025 Oral VisCRA多模态大语言模型视觉链推理攻击
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网