游乐游手机版
首页/科技数码/文章详情

千寻智能Spirit v1.5登顶RoboChallenge同步开源

时间:2026-06-03 12:37
千寻智能Spiritv1 5登顶RoboChallenge榜首并开源。该模型采用VLA一体化建模范式,摒弃理想化演示数据,引入开放式非脚本化数据采集机制,显著提升泛化性与稳定性,在端到端具身智能领域展现卓越性能。

千寻智能 Spirit v1.5 登顶 RoboChallenge,开源策略背后的技术深意

在具身智能领域,近期迎来了一项重磅消息:千寻智能推出的 Spirit v1.5 模型,在权威评测平台 RoboChallenge 的最新排行榜上成功斩获全球第一,将 Pi 0.5 甩在身后。这意味着什么?简而言之,在端到端具身智能这条赛道上,Spirit v1.5 已通过公开的 benchmark 验证了自身实力。

目前,Spirit v1.5 的完整模型权重、部分已公开的微调任务权重,以及配套的推理与部署示例均已正式开源。其余内容将按照计划分阶段逐步开放。作为一款面向现实世界任务的端到端具身智能基础模型,Spirit v1.5 致力于在统一架构下实现三大核心能力:泛化性——能够适应不同任务与机器人本体;稳定性——可长时间连续执行复杂操作;准确性——对操作目标与动作结果保持高精度控制。

关注模型设计的读者可能会注意到,Spirit v1.5 采用了 Vision-Language-Action(VLA)一体化建模范式。视觉感知、语言理解、动作生成三者深度融合在同一个决策通路中,从而避免了传统多模块级联带来的信息衰减问题,长周期任务的鲁棒性也因此显著提升。换言之,并非简单拼合几个模块,而是从一开始就联合训练,效果自然更加连贯。

而它最大的突破,其实隐藏于训练策略之中。千寻智能的技术博客明确表示:他们摒弃了对高度筛选、高度可控的“理想化”演示数据的依赖。这类脚本化数据虽然能帮助模型快速收敛,但会严重削弱其应对开放世界动态场景的能力。换句话说,如果只让模型在完美环境下练习,一旦进入真实世界遇到遮挡、干扰便会束手无策,那么再快的收敛也毫无意义。

因此,Spirit v1.5 在预训练阶段引入了开放式、非脚本化的数据采集机制。数据收集不拘泥于预设任务流程,而是以“达成有意义的实际目标”为根本导向,允许操作过程自然融合多个子任务与底层技能。这样一来,模型在训练初期就能接触到遮挡干扰、失败重试、任务无缝衔接等真实挑战。打个比方,不是让运动员只练标准动作,而是直接将其投入实战赛场进行磨砺。

相关的消融研究也印证了这一点:在同等数据量下,采用多样化数据预训练的模型,面对全新任务时迁移效率更高;达成相同性能指标所需的计算开销大幅降低。这也是 Spirit v1.5 能在 RoboChallenge 平台上,面对多形态机器人构型和未见过的任务时,展现出卓越泛化与稳定执行能力的根本原因。

顺便介绍一下 RoboChallenge。该平台是 2025 年正式启动的标准化评测体系,由 Dexmal、Hugging Face 等国际知名机构联合发起,专注于评估具身智能模型在不同硬件平台间的通用性与可迁移性。作为当前最具代表性的具身智能 benchmark 之一,它强调真实机器人实体的闭环执行能力,评测维度涵盖复杂语义指令解析、多阶段操作规划、跨环境行为一致性等关键指标。能够在该平台上夺得第一,含金量自然不言而喻。

来源:https://www.php.cn/faq/1975674.html?uid=1246273
上一篇华硕正式发布全球第一款Wi-Fi 8旗舰级无线路由器ROG GT-B 下一篇2030年活跃Agent数量将达22.16亿
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
加油站卖车 全国首座能源汽车综合服务站落地
科技数码 · 2026-06-04

加油站卖车 全国首座能源汽车综合服务站落地

广汽集团与中国石化在广东湛江遂溪建成全国首座“能源+汽车”综合服务站,推出加油站+汽车销售+维保一体化新模式,填补县域市场跨界空白,构建看车、购车、养车、加油一站式用车服务生态圈。

谷歌被曝研发至少8款Googlebook安卓本 今秋发布
科技数码 · 2026-06-04

谷歌被曝研发至少8款Googlebook安卓本 今秋发布

谷歌正在研发至少8款Googlebook安卓笔记本,计划今年秋季发布。其中4款搭载英特尔PantherLake芯片,3款采用高通骁龙X系列,1款配备联发科迅鲲Ultra芯片并支持可拆卸键盘设计。

巴菲特重仓谷歌而非英伟达的投资逻辑
科技数码 · 2026-06-04

巴菲特重仓谷歌而非英伟达的投资逻辑

伯克希尔·哈撒韦重仓谷歌而非英伟达,因其看好AI基础设施的长期价值。谷歌拥有搜索现金流、云服务和数据中心,商业模式可预测。伯克希尔认为投资“卖铲子的人”更具确定性,而非高风险的AI模型公司。

2026年WWDC最值得关注的升级与实操避坑指南
科技数码 · 2026-06-04

2026年WWDC最值得关注的升级与实操避坑指南

2026年苹果全球开发者大会预计将聚焦于人工智能与操作系统的深度融合。iOS18、iPadOS18等系统或将迎来AI原生体验的全面升级,包括更智能的Siri、系统级AI助手以及开发工具的革新。对于开发者和用户而言,了解新特性适配、隐私数据准备以及测试流程是顺利过渡的关键。

iPhone语音备忘录内置AI转写功能iOS 18起无
科技数码 · 2026-06-04

iPhone语音备忘录内置AI转写功能iOS 18起无

你是否也遇到过这样的场景——会议刚结束、课程刚刚听完、采访也收了尾,手机里却躺着一段十几分钟甚至更长的录音,亟待整理成文字? 原本想着快速转成文本,结果反复暂停、回放、快进,三十分钟的音频硬生生耗了一个多小时才逐字敲完。不少人不得不下载第三方转写工具,到头来却发现——付费门槛才是真正的绊脚石。 其实