首页 游戏 软件 资讯 排行榜 专题
首页
AI
生数科技Motubrain动作模型发布引领机器人智能新纪元

生数科技Motubrain动作模型发布引领机器人智能新纪元

热心网友
39
转载
2026-05-18

机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。

生数科技发布世界动作模型Motubrain,为机器人智能带来

正如其“一个大脑,无限可能”的口号所揭示的,这标志着行业正经历一场根本性转向:从依赖特定任务、特定硬件的碎片化方案,迈向寻求通用、统一的智能解决方案。这一转变已获得权威验证。在具身智能领域两大严苛评测基准——WorldArena和RoboTwin 2.0上,Motubrain均取得了顶尖成绩。这印证了生数科技创始人朱军的核心理念:真正的世界模型,必须构建对现实世界的统一认知,并能预测其动态演变。视频作为承载时间、空间、运动与因果关系的最佳载体,是达成这一目标的关键。他认为,通用世界模型不应是模块的简单堆叠,而应是一个将感知、推理、预测、生成与行动深度融合的统一架构,这才是连接数字智能与物理世界的桥梁。

顶尖基准评测表现

具体而言,在评估机器人感知、预判与规划能力的WorldArena基准上,Motubrain获得了63.77的具身世界模型评分,位列全球最佳模型行列。而在更侧重实际任务执行的RoboTwin 2.0基准上,其表现更为卓越:在50项预设任务中平均得分高达96.0,并且是唯一一个在随机动态环境中得分超过95.0的模型,初步验证了其出色的稳定性和强大的泛化能力。

四大核心原则重新定义具身AI

Motubrain的突破性成就,源于其背后四大核心设计原则。这四点共同勾勒出新一代机器人智能的演进方向:

一脑多能: 传统范式是“一个任务,训练一个模型”。Motubrain则颠覆了这一思路,采用单一模型处理多种类任务。其独特之处在于,任务种类越丰富,模型的整体智能与可靠性反而越强。这意味着,无论是拧螺丝、抓取物体还是更复杂的操作,都无需再为每项技能单独训练专用模型。

一脑通用: 该模型并非为某款特定机器人定制,而是被设计成一个能够驱动多种形态机器人的“通用大脑”。这直接打破了“一机一模型”的传统桎梏。随着更多机器人类型和场景数据的持续汇入,这个大脑将不断进化,并让整个生态中的每个参与者受益。

一脑端到端: 机器人不再仅仅学习孤立的“抬手”、“抓握”等原子动作。Motubrain能够直接学习并理解包含多达10个原子动作的完整任务序列。这使得机器人能从全局视角理解“把花插进花瓶”这样的多步骤复合任务,而非机械地执行被分解的指令。

一脑预判: 模型能够在执行动作的同时,预测世界状态的变化。环境信息、任务进展和执行过程在同一个模型内协同处理与优化,而非由几个独立的子系统“分段处理”再拼接结果。这使得机器人的行为反应更连贯、更符合物理直觉。

统一多模态架构

为实现上述目标,坚实的技术架构是基石。Motubrain基于统一的多模态模型构建,将视频和动作作为两种连续的模态进行联合学习。通过一次训练,即可同时赋予其五项核心能力:视觉-语言-动作控制、世界建模、视频生成、逆动力学建模以及视频-动作联合预测。

其核心是一个创新的三流混合Transformer架构,能够高效整合处理视频、动作和语言信息。这使得模型能够同步理解环境状态、遵循自然语言指令、预测未来变化并生成精确动作。与那些将感知、规划、控制模块像流水线一样串联的传统系统不同,Motubrain实现了一个完整的智能闭环处理。

更广泛的数据学习范式

Motubrain的“训练食谱”远比传统机器人AI更为丰富多元。其训练数据不仅包括精心标注的机器人动作数据,还广泛涵盖了海量的未标注通用视频、无语言说明的任务录像,以及来自不同机器人平台的数据。其特有的潜在动作框架,能够直接从人类演示视频、仿真数据等大规模视频源中,自动提取物理运动规律,无需人工对每个动作片段进行繁琐标注。

这种更广泛、更接近真实世界分布的学习范式,带来了显著的规模效应优势。在任务规模扩展测试中,随着训练任务数量的增加,Motubrain的平均成功率持续攀升,在50项任务时达到约92%。相比之下,作为对照的Pi-0.5模型在同等任务范围内,成功率则下滑至约68%。在数据规模测试中,其优势同样明显。

这一切得益于其基于六层数据金字塔设计的三阶段训练流程。这套科学流程确保了Motubrain既能实现跨环境和跨机器人类型的技能泛化,又能在具体部署时保持对细节的精确控制。

从执行任务到真正完成任务

那么,实际应用效果如何?在真实世界测试中,搭载Motubrain的机器人展现出了超越传统系统的强大适应能力,能够流畅执行完整的多步骤任务。例如,在不断变化的桌面条件下将鲜花稳定插入花瓶,甚至协调双臂分别完成不同的子目标。

一个值得关注的细节是:当机器人用勺子舀取物品却意外舀空时,它能够自主识别出“本次操作未成功”,然后自动重新尝试舀取动作——尽管它从未被专门编程或训练过“重试”这一特定行为。

这看似微小的差异,实则标志着一个根本性的范式转变:机器人正从“机械地执行预设步骤”转向“真正理解任务目标并主动寻求完成”。

已投入实际部署

值得注意的是,Motubrain并非停留在论文或演示阶段的“研究模型”,它已经进入了商业化运营阶段。目前,已有多家领先的机器人公司将其应用于正在进行的实际项目训练,并在工业、商业及家庭环境的真实硬件上进行部署。

为进一步打磨其在复杂真实世界中的性能,生数科技已与星动纪元、SimpleAI和Anyverse Dynamics等合作伙伴建立了深度研发合作,共同聚焦于基础模型演进、多模态数据融合、数据基础设施构建以及软硬件全栈优化等关键领域。

战略布局:Vidu与Motubrain双轮驱动

从公司战略层面看,Motubrain是生数科技继Vidu之后打造的又一核心支柱。Vidu作为其旗舰视频生成平台,最新版本已在多项权威评测中登顶。两款产品虽应用场景不同,但底层技术同源:正是让Vidu成为顶尖视频生成工具的世界模型技术,赋予了Motubrain在物理世界中预测和行动的能力。简而言之,Vidu负责生成和模拟数字世界,而Motubrain则负责在其中进行具身的行动与交互。

生数科技近期完成了由阿里云领投的2.93亿美元B轮融资,其他投资方包括中国互联网投资基金、好未来、百度风投和光源资本。凭借已经落地的商业部署案例,以及在深度环境理解与高效任务执行方面的顶尖评测成绩,这家公司正以清晰的领导者姿态,引领行业迈入全新的“物理AI时代”。

Q&A

Q1:Motubrain是什么?它与传统机器人AI系统有什么区别?

Motubrain是一个旨在充当机器人“通用大脑”的世界动作模型。其核心区别在于,它采用单一的统一模型,替代了传统系统中各自为政的感知、规划、控制等专用模块。它将所有核心能力整合在一个架构内,无需为每项技能单独训练,且任务越复杂、种类越多样,模型的综合表现反而越优异。同时,它支持驱动多种形态的机器人硬件,打破了“一个机器人对应一个专用模型”的传统限制。

Q2:Motubrain在主流评测基准上表现如何?

在具身智能领域两大权威评测基准上表现领先。在WorldArena基准上获得63.77的评分;在RoboTwin 2.0基准上,50项任务平均得分高达96.0,是唯一在随机动态环境中得分超过95.0的模型。在扩展性测试中,其优势同样显著,在50项任务时成功率约92%,远超对照模型。

Q3:Motubrain目前是否已经商用?有哪些合作伙伴?

是的,它已正式投入商业运营,多家头部机器人公司正将其用于实际项目的训练和硬件部署。生数科技已与星动纪元、SimpleAI和Anyverse Dynamics达成深度研发合作。公司也完成了由阿里云领投、阵容强大的2.93亿美元B轮融资。

来源:https://ai.zhiding.cn/2026/0516/3187219.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

美团小黄蜂机器人落地重庆机场 外卖10分钟直达登机口
业界动态
美团小黄蜂机器人落地重庆机场 外卖10分钟直达登机口

4月29日,美团旗下“小黄蜂”室内外智能配送机器人正式进驻重庆江北国际机场T3航站楼,这一消息在科技与出行领域引发广泛关注。此次落地标志着该款机器人首次在西南地区大型航空枢纽实现运营,意味着智能配送服务正深度渗透至高流量、高标准的交通枢纽场景。 即日起,旅客在江北机场候机时将体验到全新升级的服务。通

热心网友
05.17
机器人外呼系统每月费用解析与报价指南
业界动态
机器人外呼系统每月费用解析与报价指南

机器人外呼系统一个月的费用究竟是多少?这是许多企业在考虑部署AI智能呼叫时,首要关注的核心问题。毫无疑问,将人工智能技术融入外呼体系,能够实现高效率的客户触达、智能化的呼叫管理,并快速覆盖更广泛的目标人群,其技术优势与商业价值十分显著。然而,面对市场上多样化的报价方案与计费模式,不少决策者难免感到困

热心网友
05.17
DNF男机械师刷图连招技能一键设置方案
游戏攻略
DNF男机械师刷图连招技能一键设置方案

千海天版本全新推出的一键连招功能,为众多职业带来了操作体验的革新。对于男机械师这类依赖快速倾泻大量技能的职业而言,此系统堪称如虎添翼。它能帮助你流畅衔接技能、有效取消技能前后摇,从而将高额爆发伤害压缩在更短的时间内。那么,如何为DNF男机械师设置一键连招,才能实现伤害最大化呢?本文将提供一套经过实战

热心网友
05.17
2025年RPA机器人软件选型指南与选购攻略
业界动态
2025年RPA机器人软件选型指南与选购攻略

在数字化转型与人工智能技术深度融合的今天,降本增效已成为企业生存与发展的关键命题。传统的RPA(机器人流程自动化)技术早已超越简单重复劳动的替代阶段,通过与AI结合,正深入企业核心业务流程,成为驱动运营效率提升的战略性引擎。步入2025年,随着大模型技术的广泛应用,RPA实现了从“规则执行者”到“智

热心网友
05.17
实在智能RPA如何实现多源数据融合驱动机器人高效运行
业界动态
实在智能RPA如何实现多源数据融合驱动机器人高效运行

在数据驱动的时代,企业面临的挑战往往不是数据太少,而是数据太多、太杂。来自内部系统、外部平台、传感器、文档等不同源头的数据,格式各异、结构不一,如同散落各处的拼图碎片。如何将这些“多源异构”的数据有效整合,提取出真正有价值的信息,成为挖掘数据金矿的关键第一步。而在这个过程中,自动化技术的引入,尤其是

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

生数科技Motubrain动作模型发布引领机器人智能新纪元
AI
生数科技Motubrain动作模型发布引领机器人智能新纪元

机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示

热心网友
05.18
xAI发布编程助手Grok Build 进军AI编程工具市场
AI
xAI发布编程助手Grok Build 进军AI编程工具市场

xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。

热心网友
05.18
谷歌更新垃圾内容规则 AI操纵行为将被处罚
AI
谷歌更新垃圾内容规则 AI操纵行为将被处罚

近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企

热心网友
05.18
太浩湖能源危机:AI产业推高电价冲击硅谷后花园
AI
太浩湖能源危机:AI产业推高电价冲击硅谷后花园

硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到

热心网友
05.18
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源
AI
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源

这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应

热心网友
05.18