首页 游戏 软件 资讯 排行榜 专题
首页
AI
中国研究院:人形机器人学会后空翻与霹雳舞,精准率达90%以上

中国研究院:人形机器人学会后空翻与霹雳舞,精准率达90%以上

热心网友
82
转载
2026-03-10


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

智东西
作者 江宇
编辑 漠影

今年春晚,人形机器人再次成为舞台上的焦点。

相比去年颤颤巍巍地扭秧歌,宇树人形机器人已经能够流畅地完成武术、双节棍、醉拳等一系列表演,一波丝滑操作让全网直呼惊艳,也让大众真切感受到人形机器人技术的进步。


随着人形机器人运动能力持续突破,一些支撑这些极限动作的关键技术也开始浮出水面。

近日,北京通用人工智能研究院(简称“通研院”)发布并开源新一代人形机器人通用运动框架OmniXtreme(通极)。

该框架让机器人能够通过一套统一策略完成包括后空翻、托马斯全旋、武术踢击等在内的多种高动态动作,并在真实机器人上实现了超过90%的成功率。

该成果提出了一种新的训练路径:不再为每个动作单独训练策略,而是通过生成式模型与强化学习结合的方式,让机器人掌握一整类极限运动能力。

通研院研究员贾宝雄在接受智东西采访时称:“过去很多机器人控制模型都需要针对单个动作反复调参。OmniXtreme的核心目标,就是找到一种统一策略,让机器人能够学习并泛化不同类型的极限动作。”

一、从“太奶”到“武神”,人形机器人的运动能力跃迁

这一轮人形机器人的火热出圈,可以追溯到2024年的北京大学春季运动会。当时,北京大学智能学院学生方阵中的机器人因步态缓慢、动作僵硬,被网友戏称为“太奶机器人”。


▲2024年4月,北京大学春季运动会智能学院学生方阵

此后两年,人形机器人运动控制能力快速迭代。

2025年蛇年春晚,机器人已经可以完成扭秧歌等舞蹈动作,但整体动作仍然偏机械。同年8月,在首届世界人形机器人运动会上,通研院团队凭借融合探戈、太极、恰恰的舞蹈表演,获得单机舞蹈比赛冠军。


▲2025年8月,通研院在首届世界人形机器人运动会上获得单机舞蹈比赛冠军

到2026年春晚,《武bot》节目中机器人完成武术动作,运动能力进一步突破。

在贾宝雄看来,这一变化背后是一种“技术破壁”,他对智东西形容这一过程时用了一个词:“破次元壁”。“以前机器人更多停留在实验室或者科研展示中,很少有人会觉得它能做到现在这种程度。但随着算法和硬件快速迭代,我们逐渐接受机器人不仅能跳舞,还能完成很多高难度动作。”

二、一套算法完成极限动作,OmniXtreme解决“多动作控制难题”

让机器人完成翻腾、倒立、霹雳舞等高动态动作,一直是机器人控制领域的难题。

近年来,强化学习成为主流技术路线。通过大规模仿真训练,机器人可以逐渐学会复杂动作。但当动作种类越来越多时,系统往往会面临新的问题——动作越多,控制精度越下降。

OmniXtreme试图解决的正是这个问题,该框架采用一种两阶段学习机制。

第一阶段,研究团队先为不同动作训练多个“专家策略”,再利用生成式建模方法,将这些专家能力融合为统一策略。这一过程借鉴了生成模型中的Flow Matching技术,使系统能够学习“动作分布”,而不是简单的动作映射。

▲机器人执行OmniXtreme(通极)框架完成极限运动动作

贾宝雄用一个类比解释这一过程:“可以把它理解为先让机器人去模仿很多顶级舞者的动作,然后再在这个基础上通过强化学习不断调整,使它能够在真实环境中稳定完成这些动作。”

相比传统强化学习需要不断通过奖励函数逼近目标动作,生成式模型在一开始就能建立更完整的动作表达,因此在多动作场景下具有更好的泛化能力。

二、跨过Sim2Real,人形机器人终于能在真实世界翻跟头

在人形机器人研究中,Sim2Real(仿真到真实)一直是核心挑战。很多动作在仿真环境中可以完成,但部署到真实机器人时往往会失败。

OmniXtreme的第二阶段训练,重点解决的正是这一问题。研究团队在强化学习过程中加入了大量真实物理因素,例如:

•电机扭矩—速度关系建模
•制动功率限制
•电池能量传递模型
•更真实的执行器物理模拟

这些设计显著提升了策略在真实机器人上的可执行性。贾宝雄告诉智东西,过去很多团队在部署时需要通过网线连接主机进行控制,而OmniXtreme的目标是实现完全上机运行。

“真正的难点不只是算法本身,还包括模型推理效率和硬件适配。如果这些问题解决,再加上稳定的控制模型,就可以实现现在这种真实部署效果。”实验结果显示,在真实机器人测试中,该方法在多种高动态动作任务上的成功率超过90%。


▲真机部署成功率

在不少人看来,翻跟头、跳舞等动作更像“炫技”,似乎与实际应用关系不大。对此,贾宝雄给出了另一种解释:“从科研角度来说,如果机器人能完成这些极限动作,那么在人类能做到的工作场景里,它通常也能胜任。”

他将这一过程比作“先强身健体”,还补充道:“如果机器人能够掌握人类极限运动的控制能力,那么在工业、服务等场景中的任务执行,其实反而会更容易。”

因此,极限运动能力往往被视为机器人控制能力的“上限测试”。

四、 企业做本体、研究院做大脑,一条人形机器人研发路径浮现

值得一提的是,这项研究的主要作者均来自北京通用人工智能研究院通用人工智能协同攻关合作体人才培养计划(简称“通计划”)的联培博士生。

在研发模式上,通研院采用了一种分工协作的路径:企业负责机器人本体,研究院负责核心智能算法。例如,通研院与宇树科技合作建设具身智能联合实验室展开协同研究。


▲2025年9月,通研院在国际机器人学习大会CoRL获杰出论文奖

贾宝雄介绍,很多技术突破其实来自双方工程师之间的交流,“有些仿真和现实之间的差距,是我们和硬件工程师一起讨论后才发现的。”

在产业化方面,通研院还孵化了具身智能创业公司德塔智能(Delta Intelligence)。德塔智能通过通研院积累的技术能力,在工业制造、巡检、家居等场景中探索人形机器人的实际应用。目前相关技术已经在电网巡检、汽车制造等场景开展测试。

支撑这套路径的,还有通研院的人才机制。OmniXtreme的研发团队主要来自通研院“通计划”博士生培养项目。该项目由通研院联合全国多所高校开展,目前已培养300余名人工智能领域博士生。

贾宝雄介绍称,团队目前约有10至20名博士生参与人形机器人研究,“很多学生既在研究院做算法,也会去企业和工程师一起解决真实问题。”

结语:下一步是让机器人真正走进现实

在贾宝雄看来,人形机器人接下来有两个方向会同时推进。

一方面,技术仍然会继续挑战更高难度动作,例如跑酷、复杂环境运动等。另一方面,机器人也需要逐渐进入真实生活场景。

“未来机器人既可能像现在这样参与比赛,也可能成为日常生活中的助手,”他说。

当运动能力、感知能力和自主决策能力逐渐融合,人形机器人距离真正进入现实世界,也许只差最后一次“破壁”。

来源:https://www.163.com/dy/article/KNGGJAJJ051180F7.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌或将Chromebook更名为ChromeOS电脑
科技数码
谷歌或将Chromebook更名为ChromeOS电脑

谷歌计划联合多家主流PC厂商,将Chromebook品牌升级为“Googlebook”。新产品将深度集成Gemini等AI服务,并强化与安卓设备的跨端协同。其具体功能与可能搭载的新操作系统,有望在即将举行的谷歌活动中揭晓。

热心网友
05.13
谷歌Chromebook或将更名新名称曝光
科技数码
谷歌Chromebook或将更名新名称曝光

科技圈今日迎来一则颇具分量的行业动态:据网页存档记录显示,谷歌正携手数家主流OEM制造商,酝酿将我们熟知的“Chromebook”品牌,全面升级为“Googlebook”。 这一消息最初由知名科技媒体XDA提前泄露,尽管相关报道很快被撤下,但眼疾手快的Reddit社区用户已保存下关键页面快照,使得该

热心网友
05.13
Midjourney生成偶像打歌服舞蹈动作的AI绘画教程
AI
Midjourney生成偶像打歌服舞蹈动作的AI绘画教程

想用Midjourney生成一张既有动感舞姿,又穿着华丽打歌服的偶像舞台图?这事儿听起来简单,但直接丢个“跳舞的偶像”给AI,出来的结果往往不是动作僵硬,就是服装跑偏。别急,要精准拿捏这种高动态、高细节的风格,其实有一套经过验证的“组合拳”。 一、用动态姿态词+专业舞蹈术语构建提示 Midjourn

热心网友
05.12
视觉语言模型VLA发展前景与市场争议深度解析
AI
视觉语言模型VLA发展前景与市场争议深度解析

不能因为VLA有短板,就把世界模型推上神坛。 “So let s all take a moment of silence for our dear friend VLAs They ve served us well, rest in peace, long live World Action

热心网友
05.12
Midjourney视频动作优化指南提示词技巧实战解析
AI
Midjourney视频动作优化指南提示词技巧实战解析

MidJourney视频动作僵硬常因提示词未能描述真实运动规律。优化关键在于:精确描述动作的时间连续性、节奏与物理约束;为关键部位设定稳定性锚点;合理搭配动态参数;将复杂动作拆解为分镜级描述。通过显式排除违反常识的运动,并强化帧间一致性,可显著提升动作的自然流畅度。

热心网友
05.10

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年USDT交易软件排行榜:安全可靠的平台推荐与选择指南
web3.0
2026年USDT交易软件排行榜:安全可靠的平台推荐与选择指南

本文介绍了2026年主流的USDT交易软件,重点分析了币安、欧易和火币三大平台的特点与优势。内容涵盖平台安全性、交易功能、用户体验及费用结构,旨在为不同需求的用户提供选择参考。文中强调选择平台时应综合考虑资产安全、操作便捷性和交易成本,并提醒注意风险管理与合规操作。

热心网友
05.14
2026年USDT交易软件推荐:十大安全靠谱平台深度评测
web3.0
2026年USDT交易软件推荐:十大安全靠谱平台深度评测

本文介绍了USDT交易的基本概念与主流平台选择。USDT作为稳定币,其交易主要通过加密货币交易所进行。选择平台时需综合考虑安全性、流动性、手续费和用户体验。文中列举了当前市场认可度较高的几类交易平台,并提醒用户注意资产安全与合规操作,建议根据自身需求谨慎选择。

热心网友
05.14
哥本哈根大学新研究探索AI推荐系统如何消除偏见实现公平
AI
哥本哈根大学新研究探索AI推荐系统如何消除偏见实现公平

哥本哈根大学计算机科学系于2026年3月发布了一项具有里程碑意义的研究(论文编号arXiv:2603 12935v1),揭示了当前主流AI推荐系统可能潜藏的社会偏见风险。这项研究同时指出,一种高效且低成本的解决方案——提示工程,或许能成为破解这一难题的关键。 当您使用求职平台或新闻资讯应用时,背后的

热心网友
05.14
港科大团队创新图像修复技术:仅需千张训练图,视频生成模型效果媲美百万数据
AI
港科大团队创新图像修复技术:仅需千张训练图,视频生成模型效果媲美百万数据

照片模糊了、雨滴遮挡了画面、夜晚拍摄噪点过多……这些常见的图像质量问题,往往让人束手无策。传统的解决方案,就像请来一群专科医生:去模糊、去噪点、去雨滴,各有各的专长,但每个“医生”都需要海量的“临床经验”——动辄数百万张训练图片,才能达到可用的修复水平。 然而,一项由香港科技大学、哈尔滨工业大学深圳

热心网友
05.14
UBC与Vector研究院攻克AI资源管理难题 机器人低成本高效运行指南
AI
UBC与Vector研究院攻克AI资源管理难题 机器人低成本高效运行指南

这项由英属哥伦比亚大学(UBC)与Vector人工智能研究院联合主导的前沿研究,于2026年3月以预印本论文(arXiv:2603 12634v1)形式发布。研究团队创新性地提出了“预算感知价值树搜索”(Budget-Aware Value Tree Search,简称BA VT)框架,旨在攻克一个

热心网友
05.14