开源多模态大模型UnifoLM-VLA:宇树科技的跨模态视觉语言进展
1月29日,机器人公司宇树科技正式宣布开源其视觉-语言-动作大模型 UnifoLM-VLA-0。这一模型致力于突破传统视觉语言大模型在物理交互中的局限,通过有针对性的预训练,使其从图文理解能力进化为具备物理常识的“具身大脑”。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,UnifoLM-VLA-0 是 UnifoLM 系列中专门面向通用人形机器人操作的模型。它基于开源的 Qwen2.5-VL-7B 模型构建,并使用了覆盖通用场景与机器人专用场景的多任务数据集进行持续预训练,从而提升模型对几何空间与语义逻辑的对齐能力。
模型的核心突破在于针对操作任务的高要求,深度融合了文本指令与2D/3D空间细节,并构建了全链路动力学预测数据以增强任务泛化性。特别地,宇树在模型架构上集成了动作预测头,并对开源数据集进行了系统性清洗,最终仅利用约340小时的真机数据,结合动作分块预测与动力学约束,实现了对复杂动作序列的统一建模与长时序规划。
评估结果显示,该模型在多个空间理解基准上的能力较基础模型有显著提升,并在“no thinking”模式下可媲美 Gemini-Robotics-ER 1.5。在 LIBERO 仿真基准测试中,其多任务模型也取得了接近最优的性能。
在真机验证环节,UnifoLM-VLA-0 在宇树 G1 人形机器人平台上,仅凭单一策略网络即可高质量完成开闭抽屉、插拔插头、抓取放置等12类复杂的操作任务。最新测试表明,即使在外部扰动条件下,模型也表现出良好的执行鲁棒性与抗干扰能力。
目前,该模型的项目主页与开源代码已在 GitHub 平台公布,供开发者与研究人员获取。
相关攻略
IT之家 4 月 1 日消息,谷歌 DeepMind 昨日推出 Veo 3 1 Lite 视频模型,是该公司迄今为止最实惠的视频生成工具。最新数据显示,Lite 版的生成速度和 Fast 版本保持一
今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。这是三天之内DeepSeek第二次发生服务故障
3月29日晚至30日上午,在经历长达12小时的宕机后,DeepSeek“崩”上热搜。大量用户反映网页端和App提示“服务器繁忙”或无法响应,据了解,这是DeepSeek有史以来最长的一次“罢工”。而
IT之家 3 月 31 日消息,小米创办人、董事长兼 CEO 雷军今日分享了 MiMo-V2-Pro 大模型最新“战绩”。在大模型权威评测榜单 Text Arena,MiMo-V2-Pro 凭借在复
3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig
热门专题
热门推荐
洛克王国世界40级进阶无推图阵容打法攻略 在《洛克王国世界》的成长之旅中,达到40级是一个关键的进阶门槛。许多玩家可能会发现自己并未刻意组建一支成型的推图队伍,面对这个挑战时有些无从下手。这篇攻略将为你详细解析一套无需专门推图阵容的通关思路,帮助你利用现有资源,轻松突破40级进阶关卡。 核心阵容搭配
这城有良田主C僚属红品宝玉词条搭配攻略 在《这城有良田》中,红品宝玉的词条选择,是决定你主C僚属最终伤害上限的核心环节。面对各式各样的属性词条,不少玩家会感到困惑:如何搭配才能最大程度激发核心输出的潜力?本文将为你系统解析主C位红品宝玉的挑选逻辑与进阶策略,助你在资源投入上实现收益最大化,显著提升队
哔哩猫手表版优化指南:适配小屏的关键设置 想在智能手表上流畅体验哔哩猫?直接安装手机版本,往往会遇到界面拥挤、操作不便的问题。其实,只需调整几个核心选项,就能让哔哩猫完美匹配手表的小屏幕,操作体验大幅提升。 1、DPI优化:精准调节显示密度 手表屏幕空间有限,默认的显示比例常常导致文字过大、布局浪费
《深海迷航冰点之下》咖啡机使用全攻略:生存必备热饮制作指南 在《深海迷航冰点之下》这片危机四伏的极地海域中,新手面临的第一个致命威胁往往是持续不断的体温流失。与前作不同,身体失温在游戏前期是核心生存挑战之一。有效应对失温的方法主要有:尽快解锁并制作抗压潜水服的升级模块——防寒服、靠近能提供热源的炽热
三国志王道天下吕布骑阵容玩法攻略 在策略手游《三国志王道天下》中,构建强力阵容是核心乐趣。以飞将吕布为核心的群雄骑兵队,以其惊人的爆发力与爽快的操作体验,备受玩家关注。本攻略将为你详细解析这套阵容的构建精髓、核心机制与实战搭配思路,助你打造一支所向披靡的突击铁骑。 阵容构成 这套阵容以纯粹的群雄阵营





