首页 游戏 软件 资讯 排行榜 专题
首页
AI
具身智能机器人安全综述:LLM如何跨域物理鸿沟?

具身智能机器人安全综述:LLM如何跨域物理鸿沟?

热心网友
99
转载
2026-01-25

这项最新研究首次系统性地探讨了大型语言模型控制机器人时面临的安全威胁、防御机制与未来挑战,并指出LLM在物理世界中的“具身鸿沟”可能导致其执行危险操作,而现有防护体系存在逻辑与物理层面的脱节等问题。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

具身智能正经历从技术实验走向真实世界应用的关键转型。

大型语言模型赋予了机器人强大的逻辑推理与任务规划能力,但安全风险也随之由原本单纯的“语义毒性”演变为可能造成真实物理破坏的威胁。

近期,悉尼大学与德克萨斯大学圣安东尼奥分校联合发表了一份系统性综述,首次深入探讨了LLM控制下机器人的安全威胁、防护机制及未来挑战。

论文链接已移除

核心挑战:物理属性缺失带来的“具身鸿沟”

LLM控制机器人的底层困境在于“具身鸿沟”。传统的LLM安全机制聚焦于文本输出的合规性,而具身智能则面临着“乱执行”的物理风险。

LLM具备卓越的抽象推理能力,却缺乏对物理定律及传感器数据的本质理解。这种感知与行动的脱节,可能导致系统在口头拒绝恶意指令的同时,依然在物理空间执行危险动作。

为系统性应对这一挑战,研究团队构建了目前该领域最全的攻击与防御全景分类学:

具身智能安全攻击与防御全景分类

具身层面攻击分类学:三大向量

研究团队系统性地提出了针对具身智能的攻击分类方法:

具身越狱:通过提示词工程绕过安全过滤器。攻击的关键在于确保恶意指令同时具备逻辑可执行性与物理约束适配性。

后门攻击:在模型中预设特定触发器。特定的环境视觉特征(如路边的小狗)可能诱使系统产生异常的控制指令。

提示词注入:通过污染感知层数据实施攻击。伪造的激光雷达信息或中间人攻击能直接篡改机器人的高层决策逻辑。

防御困境:碎片化与语义真空

目前的防护体系在逻辑保障与物理保障之间存在明显的断裂。

LLM控制机器人的多层防护体系

逻辑与物理脱节:传统的形式化方法(如安全芯片)能提供符号层面的逻辑验证,却难以覆盖复杂的连续动力学环境。

状态相关性:机器人的安全性具有极强的状态相关性。相同的动作在不同物理语境(如平地与悬崖边)下的安全性截然不同,静态内容过滤器无法理解这种动态语境。

多模态风险:当文字、图像、传感器数据交织在一起,单一的防御手段已不再可行。

构建立体一体的防御框架

构建具身安全基石

研究团队提出了三位一体的防护演进方向:

环境感知的安全对齐:研究重心需从文本语义对齐转向对物理后果的预测与对齐。

全生命周期防护框架:构建覆盖模型训练、供应链审计、运行时监控及形式化验证的闭环体系。

标准化基准测试:呼吁行业建立统一的评估标准,论文梳理了AGENTSAFE、EIRAD以及SafeAgentBench等前沿基准,用于量化长流程环境下的系统稳健性。

安全性不再是具身智能的附加组件,而是行业建立信任的底层基石。

来源:https://www.51cto.com/article/834623.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

【LLM】Openclaw测试评估PinchBench
AI
【LLM】Openclaw测试评估PinchBench

一、OpenClaw AI代码助手专属评测:PinchBench基准测试深度解析 为AI编程助手挑选核心大模型,常常面临信息不对称的困境。厂商公布的性能指标与实际处理复杂编码任务的表现,可能存在显著落差。如今,一项名为PinchBench(https: pinchbench com)的专业基准测试

热心网友
04.01
openclaw 实战
AI
openclaw 实战

OpenCLAW:用自然语言自动化电脑操作,告别复杂脚本时代 在传统自动化领域,我们常常需要依赖精确的坐标、元素选择器以及脆弱的脚本代码。然而,用户界面本质是为人类设计的,操作指令也应该使用人类的自然语言。今天介绍的 OpenCLAW 项目,正是这一理念的先锋。它通过自然语言描述驱动自动化任务,让人

热心网友
04.01
零基础入门 | AI Agent 框架是怎样的?有哪些部分?
AI
零基础入门 | AI Agent 框架是怎样的?有哪些部分?

Agent = Reasoning + Acting 1 1 AI Agent 框架基础理论 关于AI智能体是啥,这里摘一段Google Cloud的定义,言简意赅:“AI智能体是使用AI来实现目标并代表用户完成任务的软件系统。其表现出推理、规划和记忆能力,并且具有一定的自主性,能够自主学习、适应和

热心网友
03.31
Zoho用户量突破1.5亿:全球业务增长新里程碑
科技数码
Zoho用户量突破1.5亿:全球业务增长新里程碑

3月2日消息,在刚结束的2026年度分析师大会上,Zoho公布了一组最新相关数据:Zoho用户量突破1 5亿大关,全球付费企业客户超100万。过去一年,Zoho客户数量同比增长32%,营收增长20%

热心网友
03.02
端点安全扩展:降低LLM基础设施风险的5个关键策略
科技数码
端点安全扩展:降低LLM基础设施风险的5个关键策略

企业必须优先管理端点权限,因为暴露的端点已成为网络犯罪分子入侵LLM工作负载系统、身份凭证和敏感数据的常见攻击媒介。 随着越来越多企业部署自有大型语言模型(LLM),配套的内部服务和应用程序接口(A

热心网友
02.27

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02