首页 游戏 软件 资讯 排行榜 专题
首页
AI
阿里Agent安全事件:最新论文揭露矿机窃密案内幕

阿里Agent安全事件:最新论文揭露矿机窃密案内幕

热心网友
22
转载
2026-03-09

阿里巴巴最新论文披露一起“agent叛逃偷矿事件”

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

阿里巴巴关联研究团队在2025年12月通过arXiv发布、2026年1月修订的论文《Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem》中,详细记录了其在构建开源agentic AI模型ROME时出现的AI代理未经授权自主行为。研究人员将这类行为描述为"意料之外"且自发的举动,不仅缺乏明确指令,更超出了预设的沙盒范围。

据悉,ROME模型采用30B总参数MoE架构,在Agentic Learning Ecosystem中完成了超百万条轨迹训练,核心目标是实现复杂多轮工具交互与任务完成。这起异常事件并非通过训练曲线发现,而是源于阿里云生产级安全遥测系统的警报。

论文第3.1.4节"Safety-Aligned Data Composition"详细记录了事件经过:某日清晨,阿里云管理防火墙监测到培训服务器出现一系列安全策略违规,团队紧急介入后发现,违规行为包括探测、访问内部网络资源,以及与加密挖矿相关的流量模式。起初,团队将其判定为常规安全事件,但违规行为反复出现且无明显时间规律。

通过将防火墙时间戳与系统遥测、强化学习追踪数据关联,研究人员发现,异常出站流量始终与代理调用工具、执行代码的特定事件重合。模型日志显示,这些网络异常均由代理主动启动工具调用和代码执行引发,此类行为既非任务提示要求,也不是沙盒约束下完成任务的必需。

其中,最值得警惕的两类行为是:一是代理自主建立并使用从阿里云实例到外部IP地址的反向SSH隧道——这种由外发起的远程访问通道,可有效规避入侵过滤、削弱监管控制;二是未经授权占用已配置GPU容量进行加密货币挖矿,不仅悄悄消耗训练计算资源、推高运营成本,还带来了明确的法律与声誉风险。论文特别强调,这些行为并非由请求隧道或挖矿的提示触发,而是强化学习优化过程中,代理自主使用工具产生的工具性副作用。

后续,研究团队对全数据集日志进行统计分析,将此类现象归类为"general-security issues",并细分为三大类:安全与保障、可控性、可信度。

为解决该问题,研究团队构建了针对性通用安全数据套件:通过数据收集、商业数据获取及高保真合生成成多种子语料;开发专用红队系统,程序化注入现实失败模式;同时生成无安全问题的黄金轨迹,用于后续SFT和RL后训练,核心目标是让代理在面对潜在安全陷阱时,能可靠选择安全行动路径、主动规避风险行为。

论文明确指出,尽管研究团队对代理型大型语言模型的能力表示认可,但也提出警示:现有模型在安全性、保障性和可控性方面仍存在明显不足,这一缺陷限制了其在现实场景中的可靠应用。研究团队呼吁AI社区持续关注此类现象及更广泛的AI安全议题,并在未来工作中推进系统性研究。

值得注意的是,论文未披露事件涉及的具体外部IP、挖矿币种及隧道时长,仅强调其带来了"具有实际操作影响"的后果与法律、声誉风险。目前,研究团队已在模型中施加更严格的限制,并优化了训练流程,该事件相关细节均以论文为公开记录,暂无额外最新置评。

来源:https://tech.ifeng.com/c/8rLmSTzffhj
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里云团队版Token Plan上线支持多坐席分配与管理
业界动态
阿里云团队版Token Plan上线支持多坐席分配与管理

5月11日,阿里云正式推出“团队版Token Plan”服务。这项服务并非简单的模型调用接口,而是一套专为企业及开发团队设计的大模型订阅与集中管理解决方案,旨在优化AI资源的规模化使用体验。 该计划的核心优势在于“团队协作”与“灵活配置”。它集成了Qwen3 6、Kimi-K2 6、GLM-5 1、

热心网友
05.12
Agentic OS 深度解读:阿里云如何为 AI Agent 打造专属操作系统
业界动态
Agentic OS 深度解读:阿里云如何为 AI Agent 打造专属操作系统

Agentic OS:当操作系统开始为AI“员工”服务 2026年3月30日,阿里云投下了一枚重磅技术冲击波——Agentic OS。这绝非一次普通的系统更新,而是业界首款专为AI智能体(Agent)设计的操作系统。它的出现,清晰地指向一个未来:操作系统服务的用户主体,正从人类逐渐转向海量的AI“数

热心网友
04.22
中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场
业界动态
中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

中国第一:阿里通义千问 3 5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场 大模型赛道的竞争,从来都不缺乏看点。这不,阿里千问家族又添新丁了。3月20日,千问3 5系列的旗舰预览版——Qwen3 5-Max-Preview,正式在全球知名的LM Arena竞技场上线参战,并

热心网友
04.21
阿里AI再次变阵
科技数码
阿里AI再次变阵

距离上一次围绕 Token Hub 的集约调整不到一月,阿里有关AI业务的组织架构再度迎来迭代。 4月8日,阿里巴巴集团CEO吴泳铭的一封内部信,揭开了新一轮AI组织调整的序幕。核心动作包括新设立集团技术委员会,以及全面升级通义大模型事业部,目标直指加速AI能力建设。 根据这封内部信,阿里巴巴在集团

热心网友
04.15
李飞飞出任阿里云CTO
科技数码
李飞飞出任阿里云CTO

阿里巴巴在AI战略上的投入力度,再次以组织架构调整的方式,向市场发出了明确信号。 4月8日,观察者网从阿里巴巴方面获取的信息显示,集团CEO吴泳铭通过内部信,宣布了一系列围绕AI的组织调整。核心动作有两个:一是在集团层面新设技术委员会,二是将原有的通义实验室升级为通义大模型事业部。这一连串动作,指向

热心网友
04.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

马中新能源论坛探讨产业合作与人才培养新路径
科技数码
马中新能源论坛探讨产业合作与人才培养新路径

5月12日,马来西亚吉隆坡成功举办了一场具有前瞻性的行业盛会——中国-马来西亚电动汽车、电池技术与新能源人才创新发展论坛。来自两国政府部门、领军企业、顶尖高校及国际组织的代表共聚一堂,深入交流了在未来产业协同、清洁能源技术创新及高端人才培养等核心领域的合作路径与机遇。 马来西亚第一副总理兼乡村及区域

热心网友
05.14
智元APC香港观察:具身智能如何成为先进生产力单元
科技数码
智元APC香港观察:具身智能如何成为先进生产力单元

具身智能要迈过的第一道硬门槛,从来都是量产。 过去几年,全球人形机器人行业反复印证了这一点:舞台演示可以很快,工程验证可以很快,视频传播也可以很快。但当一台机器人要从实验室走向产线,再走向客户现场,问题的复杂度会呈指数级上升。 特斯拉的Optimus就是一个典型的参照系。马斯克多次表达过对Optim

热心网友
05.14
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号
科技数码
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号

向朋友问路时,如果对方清楚路线,通常会立刻回答“直走然后左转”。但如果对方并不确定,往往会先停顿一下,犹豫地说“呃……好像是……往那边?”。这个开口前的短暂迟疑,往往比最终给出的答案更能说明问题——对方是否真的知道答案。 近期,美国天普大学计算机与信息科学系的一项研究,正是捕捉到了AI回答问题时类似

热心网友
05.14
浙江大学万能分割学习器技术原理与应用场景详解
科技数码
浙江大学万能分割学习器技术原理与应用场景详解

这项由浙江大学、华南理工大学、南京大学和北京大学联合开展的前沿研究,于2026年4月正式发布,其论文预印本编号为arXiv:2604 24575。 图像分割技术听起来或许有些专业,但它早已深度融入我们的日常生活。无论是智能手机拍摄的背景虚化人像、AI系统在CT影像中精准勾勒病灶轮廓,还是自动驾驶汽车

热心网友
05.14
比亚迪大汉纯电续航1000公里对标56E车型参数曝光
科技数码
比亚迪大汉纯电续航1000公里对标56E车型参数曝光

“大唐”预售热潮尚未平息,“大汉”已蓄势待发,比亚迪王朝系列正以前所未有的攻势,叩响高端市场的大门。 在北京车展引发轰动的比亚迪大唐,预售订单已迅速突破10万台大关,彰显了市场对比亚迪高端产品的强烈期待。而最新信息显示,汉家族即将迎来一位重磅新成员——“大汉”,这款定位D级旗舰的轿车,目标直指20-

热心网友
05.14