壁仞人形机器人专利解析:多模态感知融合关键技术
企查查APP信息显示,近日,北京面壁智能科技有限责任公司一项名为“基于动态稀疏化激活的人形机器人多模态感知融合方法”的专利正式公布。
根据企查查专利摘要,该方法主要涵盖以下步骤:首先,获取机器人的多模态数据流,并依据其实时运行状态生成模态可用性映射;其次,采用稀疏门控策略动态选择待激活的感知模态,并基于选择结果构建激活模态集;接着,运用卡尔曼滤波算法对激活模态集进行状态评估,得到状态评估集并识别模态切换状态;当识别出模态切换时,结合任务复杂度和进度变化,构建状态评估窗口,并在该窗口内动态调整机器人状态空间维度,从而得到多模态状态集;最后,基于多模态状态集生成机器人任务执行指令,并控制其行为动作。这一方法旨在解决采用稀疏门控策略动态选择激活感知模态时,因模态切换导致的机器人状态空间维度不匹配问题。

相关攻略
近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边
随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户
编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目
引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等
想象一下这个场景: 你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下测试,没过,又改,又跑,还是没过……来回折腾了十几轮,终于——还是没修好。 你关掉电脑,松了口气。然后收到了 API 账单。 上面的数字可能让你倒吸一口凉气——AI Agent 自主修
热门专题
热门推荐
备受瞩目的MG07,现已正式登陆工信部新车公告目录。这标志着,这款全新轿跑距离正式上市发售,又迈出了关键一步。 仅从外观设计审视,MG07便展现出令人过目不忘的视觉冲击力。其造型极具张力与未来感,辨识度极高。前脸配备的锐利修长大灯组,造型已接近高性能跑车的经典风格,视觉攻击性十足。车身侧面,流畅而舒
5月15日,彭博社的一则爆料,给硅谷的科技圈投下了一颗不大不小的石子。据知情人士透露,苹果与OpenAI那场曾被视为“天作之合”的战略联姻,在持续两年后正面临破裂危机。核心矛盾点在于,OpenAI方面认为商业回报远未达预期,甚至已开始考虑采取法律手段。 由于相关讨论尚未公开,消息人士要求匿名。他们指
XPL币是Plasma生态系统的原生代币,主要用于网络治理、交易费用支付和节点激励。Plasma项目旨在构建一个高效、可扩展的区块链基础设施,其技术背景涉及分片与Layer2解决方案。XPL币的使用场景覆盖了网络治理投票、Gas费抵扣、节点质押奖励以及生态内服务支付,其价值与Plasma网络的实际采用率和生态发展紧密相连。
OpenAI成立独立咨询公司DeployCo,并获40亿美元投资。新公司将通过派驻前线工程师和收购等方式,帮助企业部署AI应用。此举标志着其战略重心从研发转向大规模企业赋能,旨在弥合AI能力与企业实际应用之间的差距。面对万亿美元规模的系统集成市场,OpenAI将与现有咨询机构形成竞合关系。
5月13日,全球跑车行业迎来战略级转向:英国传奇性能品牌路特斯(Lotus)正式公布其“Focus 2030”全新战略规划。核心决策引发广泛关注——品牌宣布调整此前激进的全面电动化路线,重启燃油及混合动力跑车的研发,未来将采取燃油、混合动力与纯电动“三线并行”的产品发展路径。 路特斯集团首席执行官冯





