大晓开源机器人原生模型：从“会表演”走向“能干活”

时间：2026-03-14 18:01

近日，大晓机器人开源开悟世界模型3 0（Kairos 3 0）-4B系列具身原生世界模型。作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型，该模型以“物理因果一致、跨本体泛化、

近日，大晓机器人开源开悟世界模型3.0（Kairos 3.0）-4B系列具身原生世界模型。作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型，该模型以“物理因果一致、跨本体泛化、超长时交互、云侧实时生成、轻量化高效能、端侧本体控制”为核心优势，性能全面领跑国内外主流具身世界模型。

Kairos 3.0-4B是全球首个可端侧驱动具身智能本体控制的世界模型，也是行业内首个在THOR端侧平台达成1:1.5（视频生成时间：视频时长）实时生成的具身世界模型。该模型部署于Jetson Thor T5000端侧平台，算力可达517TFLOPS，不仅能在3D仿真环境中精准生成机械臂运动形态、完成运动轨迹的预测与规划，更可依托THOR端侧平台实现机器人本体的真实驱动与作业执行，让机器人真正从“会表演”走向“能干活”。

以原生世界模型架构，筑牢具身智能对物理世界的底层认知

当前，具身智能行业深陷数据稀缺且割裂的困境，传统生成式模型仅侧重视频生成，缺乏对物理世界的深度认知，因此面临长时序交互不足、部署算力成本高昂、状态预测物理一致性差等行业瓶颈。

作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型，Kairos 3.0-4B并非在大语言或视觉模型后简单附加运动接口，而是从架构底层为机器人在真实世界的运行进行设计，以自然界基本物理规律与因果规律为认知根基，构建起跨本体的统一世界理解框架，打破传统具身智能“行为模仿”的技术局限，将模型能力升级至“物理级深度理解”的全新维度。

得益于原生架构的优势，该模型不再依赖昂贵且稀缺的真机数据，而是通过内化物理规律、推演因果逻辑，在更优的模型与数据规模下，实现强泛化、长时序推理与可靠的端侧部署。它能精准解析物体受力、重心、摩擦等物理约束，完成复杂任务的推理、规划与可行性分析，兼容多模态传感器指令，高效理解机器人动作与人类行为逻辑，实现从“执行指令” 到 “理解任务” 的本质跨越。

在复杂交互场景的实测中，机器人可平稳端起盛有水的托盘，运动过程中水面呈现自然真实的水波动态；将托盘放置桌面后，模型凭借任务思维链自主规划，精准判断牛奶苹果的摆放位置，有序将物品规整放置于托盘之上。

7分钟长时连贯场景动态交互

在具身智能领域，长时序视频生成始终是制约技术落地的核心瓶颈。

凭借“多模态理解—生成—预测”一体化架构，大晓机器人推出的Kairos 3.0-4B，可结合Agent智能体技术，在长时序视频生成能力上实现颠覆性突破。Kairos智能体可将用户复杂交互指令进行层级化解析与结构化拆解，依托模型对序列间的时空演化、物理规则、场景动态及交互逻辑精细化预测，补全连续世界信息，并通过自我反思机制实现闭环迭代优化。最终生成长达7分钟的具身动态交互视频，且全程保持场景连贯与物理真实，为具身智能的训练与落地开辟了全新路径。

在家庭场景范例中，机器人实现全流程一镜到底的自主作业：先有序整理桌面上的杯子与纸巾盒，规划合适位置摆放物品，随后自主进入洗衣机，捡拾衣服，打开洗衣机、完成衣物投放与清洗操作；接着穿过客厅进入厨房，开启冰箱取出牛奶，打开壁橱取出麦片，并打开抽屉取出碗与勺子，将麦片和牛奶倒入碗中，自主完成早餐制备。整个过程无断点，真实展现了模型的流畅动态交互、物体属性识别、符合物理规则的受力操控、柔性衣物物理表征能力，并依托完整任务思维链实现多场景自主规划与连贯执行，验证了模型在复杂家居环境下的物理认知、长时序推理与动态交互能力，后续将持续提升超精细操作能力。

这一能力让具身智能能够从容应对多场景下的复杂动态任务。无论是工业制造中的长流程装配，还是家庭服务中的持续交互，Kairos 3.0-4B都能生成连贯、真实的场景模拟，显著提升模型的泛化能力与部署可靠性，推动具身智能从实验室走向产业一线。

以轻量化实现高效能推理速度

Kairos 3.0-4B模型凭借架构创新与技术突破，在推理效率、算力消耗、部署适配三大维度均实现业界领先，同时突破具身智能端侧实时部署的核心瓶颈。

Kairos 3.0-4B在行业内率先实现云侧1:1实时推理，推理速度较Cosmos 2.5提升72倍。同时，它也是行业首个在THOR平台端侧部署的具身世界模型，可在端侧实现高效实时推理。依托端侧部署，模型可直接输出机器人从上肢到手指再到下肢的全方位控制指令，省去中间转译环节，让机器人“想到即可做到”。

在A800 GPU性能Benchmark中，Kairos 3.0-4B凭借自研的混合时间线性注意力算子，实现了算力效率与推理速度的数量级突破，性能全面碾压主流具身世界模型。

推理速度上，Kairos 3.0-4B完成10秒生成任务耗时仅9.5秒，比Cosmos 2.5（687.2秒）快约72倍，比Wan 2.2（85秒）快约9倍，比Lingbot（1436秒）快约151倍。

Kairos 3.0-4B 以4B轻量化参数实现23.5GB显存占用，与5B的Wan 2.2相当，远低于14B的Cosmos（70.2GB）和28B的Lingbot（46.1GB），在保持极致性能的同时，大幅降低部署门槛，完美适配具身智能端侧实时推理需求，打破“大参数=高性能”的行业固有认知。

Kairos 3.0-4B凭借极低的算力消耗与显存占用，在单卡、多卡环境下均实现业界领先的实时推理速度，完美适配英伟达、沐曦、海光、壁仞等多款GPU。其高效能特性可直接满足具身智能系统低延迟、高可靠、端侧实时部署的需求，无需依赖昂贵的真机数据，即可实现强泛化与可靠部署。

【更多阅读】大晓机器人完成天使轮融资！CEO王晓刚：具身智能是潜力无限增长迅猛的赛道

原标题：《让机器人真正从“会表演”走向“能干活”，大晓机器人开源原生具身世界模型》

栏目编辑：易蓉

来源：https://www.163.com/dy/article/KO06FGPL055040N3.html

具身模态机器人 thor 真实世界

上一篇特斯拉Cybertruck无人驾驶出租车型量产版曝光 下一篇特斯拉座椅专利揭秘：碳纤维一体框架或用于新Roadster跑车

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5

科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起，两项关乎电动汽车安全的核心强制性国家标准将正式实施，为行业加装“安全锁”——《电动汽车安全要求》（GB 18384-2025）与《电动汽车用动力蓄电池安全要求》（GB 38031-2025）同步落地。此次标准升级，从整车架构与电池系统两大维度，精准填补了近年来多起事故暴露出的