首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
大晓开源机器人原生模型:从“会表演”走向“能干活”

大晓开源机器人原生模型:从“会表演”走向“能干活”

热心网友
55
转载
2026-03-14



近日,大晓机器人开源开悟世界模型3.0(Kairos 3.0)-4B系列具身原生世界模型。作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型,该模型以“物理因果一致、跨本体泛化、超长时交互、云侧实时生成、轻量化高效能、端侧本体控制”为核心优势,性能全面领跑国内外主流具身世界模型。

Kairos 3.0-4B是全球首个可端侧驱动具身智能本体控制的世界模型,也是行业内首个在THOR端侧平台达成1:1.5(视频生成时间:视频时长)实时生成的具身世界模型。该模型部署于Jetson Thor T5000端侧平台,算力可达517TFLOPS,不仅能在3D仿真环境中精准生成机械臂运动形态、完成运动轨迹的预测与规划,更可依托THOR端侧平台实现机器人本体的真实驱动与作业执行,让机器人真正从“会表演”走向“能干活”。

以原生世界模型架构,筑牢具身智能对物理世界的底层认知

当前,具身智能行业深陷数据稀缺且割裂的困境,传统生成式模型仅侧重视频生成,缺乏对物理世界的深度认知,因此面临长时序交互不足、部署算力成本高昂、状态预测物理一致性差等行业瓶颈。


作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型,Kairos 3.0-4B并非在大语言或视觉模型后简单附加运动接口,而是从架构底层为机器人在真实世界的运行进行设计,以自然界基本物理规律与因果规律为认知根基,构建起跨本体的统一世界理解框架,打破传统具身智能“行为模仿”的技术局限,将模型能力升级至“物理级深度理解”的全新维度。

得益于原生架构的优势,该模型不再依赖昂贵且稀缺的真机数据,而是通过内化物理规律、推演因果逻辑,在更优的模型与数据规模下,实现强泛化、长时序推理与可靠的端侧部署。它能精准解析物体受力、重心、摩擦等物理约束,完成复杂任务的推理、规划与可行性分析,兼容多模态传感器指令,高效理解机器人动作与人类行为逻辑,实现从“执行指令” 到 “理解任务” 的本质跨越。


在复杂交互场景的实测中,机器人可平稳端起盛有水的托盘,运动过程中水面呈现自然真实的水波动态;将托盘放置桌面后,模型凭借任务思维链自主规划,精准判断牛奶苹果的摆放位置,有序将物品规整放置于托盘之上。

7分钟长时连贯场景动态交互

在具身智能领域,长时序视频生成始终是制约技术落地的核心瓶颈。

凭借“多模态理解—生成—预测”一体化架构,大晓机器人推出的Kairos 3.0-4B,可结合Agent智能体技术,在长时序视频生成能力上实现颠覆性突破。Kairos智能体可将用户复杂交互指令进行层级化解析与结构化拆解,依托模型对序列间的时空演化、物理规则、场景动态及交互逻辑精细化预测,补全连续世界信息,并通过自我反思机制实现闭环迭代优化。最终生成长达7分钟的具身动态交互视频,且全程保持场景连贯与物理真实,为具身智能的训练与落地开辟了全新路径。

在家庭场景范例中,机器人实现全流程一镜到底的自主作业:先有序整理桌面上的杯子与纸巾盒,规划合适位置摆放物品,随后自主进入洗衣机,捡拾衣服,打开洗衣机、完成衣物投放与清洗操作;接着穿过客厅进入厨房,开启冰箱取出牛奶,打开壁橱取出麦片,并打开抽屉取出碗与勺子,将麦片和牛奶倒入碗中,自主完成早餐制备。整个过程无断点,真实展现了模型的流畅动态交互、物体属性识别、符合物理规则的受力操控、柔性衣物物理表征能力,并依托完整任务思维链实现多场景自主规划与连贯执行,验证了模型在复杂家居环境下的物理认知、长时序推理与动态交互能力,后续将持续提升超精细操作能力。

这一能力让具身智能能够从容应对多场景下的复杂动态任务。无论是工业制造中的长流程装配,还是家庭服务中的持续交互,Kairos 3.0-4B都能生成连贯、真实的场景模拟,显著提升模型的泛化能力与部署可靠性,推动具身智能从实验室走向产业一线。

以轻量化实现高效能推理速度

Kairos 3.0-4B模型凭借架构创新与技术突破,在推理效率、算力消耗、部署适配三大维度均实现业界领先,同时突破具身智能端侧实时部署的核心瓶颈。

Kairos 3.0-4B在行业内率先实现云侧1:1实时推理,推理速度较Cosmos 2.5提升72倍。同时,它也是行业首个在THOR平台端侧部署的具身世界模型,可在端侧实现高效实时推理。依托端侧部署,模型可直接输出机器人从上肢到手指再到下肢的全方位控制指令,省去中间转译环节,让机器人“想到即可做到”。

在A800 GPU性能Benchmark中,Kairos 3.0-4B凭借自研的混合时间线性注意力算子,实现了算力效率与推理速度的数量级突破,性能全面碾压主流具身世界模型。

推理速度上,Kairos 3.0-4B完成10秒生成任务耗时仅9.5秒,比Cosmos 2.5(687.2秒)快约72倍,比Wan 2.2(85秒)快约9倍,比Lingbot(1436秒)快约151倍。

Kairos 3.0-4B 以4B轻量化参数实现23.5GB显存占用,与5B的Wan 2.2相当,远低于14B的Cosmos(70.2GB)和28B的Lingbot(46.1GB),在保持极致性能的同时,大幅降低部署门槛,完美适配具身智能端侧实时推理需求,打破“大参数=高性能”的行业固有认知。


Kairos 3.0-4B凭借极低的算力消耗与显存占用,在单卡、多卡环境下均实现业界领先的实时推理速度,完美适配英伟达、沐曦、海光、壁仞等多款GPU。其高效能特性可直接满足具身智能系统低延迟、高可靠、端侧实时部署的需求,无需依赖昂贵的真机数据,即可实现强泛化与可靠部署。

【更多阅读】大晓机器人完成天使轮融资!CEO王晓刚:具身智能是潜力无限增长迅猛的赛道

原标题:《让机器人真正从“会表演”走向“能干活”,大晓机器人开源原生具身世界模型》

栏目编辑:易蓉

来源:https://www.163.com/dy/article/KO06FGPL055040N3.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI+具身智能“造血”成功:极智嘉(02590)成为To B智能机器人赛道首个“盈利样本”
科技数码
AI+具身智能“造血”成功:极智嘉(02590)成为To B智能机器人赛道首个“盈利样本”

当下,全球AI领域的竞争早已告别“拼参数”的粗放阶段,资本市场的考量愈发务实——谁能将AI研发投入转化为真实利润,谁就能抢占先机。在这场从“技术概念”到“商业实效”的转型竞赛中,率先跑通商业闭环的企

热心网友
04.07
获京基智农控股后,汇博机器人加速具身智能从轻量到重型全谱系产品落地
科技数码
获京基智农控股后,汇博机器人加速具身智能从轻量到重型全谱系产品落地

来源:环球网【环球网科技综合报道】据36氪研究院预测,2026年中国具身智能产业将迎来两大里程碑:市场规模正式突破万亿元大关,人形机器人出货量有望冲击十万台量级,行业正式从技术探索期迈入规模化落地的

热心网友
04.07
机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法
AI
机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法

头图由智象未来AI大模型生成智东西作者 王涵编辑 漠影在演唱会、各大晚会的舞台上,机器人伴舞团以整齐划一、精准卡点的舞姿惊艳全场。这种整齐划一不仅是硬件的胜利,更是“训练有素”的结果。具身智

热心网友
04.07
全球具身智能开发者大会深圳落幕,首秀带来三大变革
科技数码
全球具身智能开发者大会深圳落幕,首秀带来三大变革

来源:科技日报科技日报记者 罗云鹏3月30日,全球首届具身智能开发者大会暨“具亮计划”黑客松・大湾区巅峰赛在广东省深圳市落幕。大会共吸引全国顶尖高校、科研院所及高新企业上百支队伍报名参赛,最终20支

热心网友
04.01
标准先行:解读新华网科技观察,如何推动具身智能产业化
科技数码
标准先行:解读新华网科技观察,如何推动具身智能产业化

  新华网北京3月31日电 题:标准先行,助推具身智能产业化  新华网 朱家齐  2026中关村论坛年会举办期间,多款具身智能机器人集中亮相,精准穿针、柔性抓取、协同歌舞、实景作业,让公众直观感受到

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南
AI
阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

热心网友
05.15
商汤小浣熊智能助手基于自研大语言模型
AI
商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

热心网友
05.15
MiniMax新一代智能模型矩阵全面解析与应用指南
AI
MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

热心网友
05.15
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景
web3.0
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友
05.15
智能客服机器人解决方案:AI客服系统提升企业服务效率
AI
智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友
05.15