千寻智能开源Spirit 1.5大模型:核心代码与完整架构详解
一月十二日,千寻智能正式开源其自主研发的VLA基础模型Spirit v1.5。就在前一天,该模型在全球具身智能模型评测平台RoboChallenge上脱颖而出,以综合评测成绩斩获榜首,超越了长期稳居该榜单的Pi0.5模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
RoboChallenge数据显示,千寻智能自研的具身智能模型Spirit v1.5在评测中取得了综合排名第一的佳绩,在任务得分与成功率两个维度上均超过了Pi0.5。
为验证榜单成绩确实源于自研模型且真实有效,千寻智能同步开源了Spirit v1.5的基础模型权重、推理代码以及使用样例,以此接受公众与研究社区的独立检验。通过这一方式,研究者不仅可以复现榜单评测结果,更能以Spirit v1.5作为具身智能的基础模型,在此基础上展开进一步的探索与创新。
公开资料显示,RoboChallenge是2025年新成立的标准化评测体系,由Dexmal与Hugging Face等机构联合发起,专注于对具身智能模型进行跨平台能力验证。其评测任务覆盖复杂指令理解、多步骤操作规划以及跨场景执行稳定性等多个维度。
从评测结果来看,Spirit v1.5在多项任务中保持较高成功率,尤其在多任务连续执行、复杂指令拆解以及跨构型迁移等维度表现稳健。截至最新评测周期,其综合得分超越了包括Pi 0.5在内的此前领先模型,位居榜单首位。
在模型架构上,Spirit v1.5采用Vision-Language-Action(VLA)统一建模框架,将视觉感知、语言理解与动作生成整合在同一决策流程中,减少了多模块串联带来的信息损耗,并提升了长程任务中的整体稳定性。
在训练方法上,Spirit v1.5的一个核心特点是它不依赖高度精选的“干净”演示数据。千寻智能在技术博客中指出,那些在过度脚本化、受控环境下采集的数据,虽然有利于模型快速收敛,却会限制其在真实世界中的泛化能力。
因此,Spirit v1.5在预训练阶段引入了开放式、多样化的数据采集模式。数据采集不再严格限定任务脚本,而是以“完成有意义目标”为导向,允许操作过程中自然串联多个子任务与原子技能。这种方式让模型在训练阶段接触到更接近真实世界的复杂性,包括遮挡、失败恢复以及任务之间的自然过渡。
相关消融实验显示,在相同数据规模下,基于多样化数据预训练的模型,在新任务上的迁移效率明显高于基于传统演示数据训练的模型。为达到相同性能所需的计算资源也显著减少。这一结果也解释了Spirit v1.5在RoboChallenge多构型、未见任务评测中的稳定表现。
千寻智能(Spirit AI)成立于2024年,总部位于杭州,由前追觅机器人联合创始人兼CTO韩锋涛发起创立,专注于具身智能机器人及通用人形机器人技术的研发与场景落地。其核心技术涵盖视觉语言模型ViLa、部件约束模型CoPa以及世界领先的运动控制系统,致力于打造通用智能机器人平台。
2025年7月,千寻智能完成了近6亿元PreA+轮融资,由京东领投,中国互联网投资基金、浙江省科创母基金、华泰紫金、复星锐正等知名机构跟投。千寻智能成立半年内相继完成种子轮、天使轮融资,累计融资金额近2亿元,其背后的资本网络横跨“中东系”“宁德系”“小米系”等,投资方包括弘晖基金、达晨创投、千乘资本等知名机构。
相关攻略
【CNMO科技】在平板电脑的江湖里,安卓阵营近几年的进步有目共睹。如果说以前,人们提到安卓平板时想到的还是“屏幕不够细腻”“性能总是慢半拍”“生态体验割裂”这些遗憾,而现在随着硬件技术的快速迭代,这
【CNMO科技消息】近日,全球权威评测机构Rtings公布了最新电视评测结果。TCL X11L以8 6分的综合评分登顶液晶电视榜首,刷新液晶电视最高分纪录,并以断崖式领先优势稳居第一。尤为值得关注的
3月27日,在北京国际科幻与未来产业博览会上,他山公司的人形机器人在展示原子动作数据采集平台精细操作场景。 本报记者 张武军摄 本报北京3月29日电 (记者刘温馨)工业和信息化部近日批准发布《YD
数码科技博主 “极客湾” 在直播中回应了旗下大横评视频被下架的原因。针对观众 “为什么横屏会被下架” 的提问,极客湾成员云飞澄清:“其实原因没有你们想的那么复杂,没有厂商搞我们的阴谋,厂商内部人很多
IT之家 3 月 28 日消息,科技博主 TechStation365 在最新一期视频中,深度评测三星的 Exynos 2600 芯片,发现该芯片在 Geekbench 6 跑分测试中,峰值功耗飙升
热门专题
热门推荐
PChome 3月31日消息,OPPO官微官宣,OPPOx哈苏影像新品联合发布会将于4月21日晚19:00在成都举办,Find X9s Pro、Find X9 Ultra等新品将至。据了解,OPPO
小红书网页版登录入口为https: www xiaohongshu com explore,支持扫码、手机号验证码及微信三种登录方式,首页默认瀑布流展示热门笔记,具备多维度内容检
两年前,谢添天发现自己的声音被一款APP“盗”走——用户输入文本,即可用他的音色生成以假乱真的AI声音。维权半年,因举证难度太高,最终以和解和对方致歉了结。两年后,一场大规模的联合发声,将AI盗声侵
来源:央广网3月28日至29日,以“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”为主题的2026中国网络媒体论坛在河南郑州举行。网络媒体因技术而诞生,凭创新而繁荣。面对新一轮科技
当大语言模型与AgenticAI(智能体)从试验场进入企业级生产环境,SaaS行业的底层价值逻辑正面临系统性重估。这一轮变革的核心,正指向“AI CRM 2 0”的全面到来——它不再是传统CRM的功





