首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
中国公司以人类数据训练AI模型斩获多项全球第一

中国公司以人类数据训练AI模型斩获多项全球第一

热心网友
85
转载
2026-05-19

今年四月,具身智能领域迎来一个值得关注的发布。灵初智能推出了两款名为Psi-R2和Psi-W0的“具身大脑”模型。更引人注目的是,在艾伦AI研究所的MolmoSpaces榜单上,Psi-R2一举超越了PI、DreamZero等国际知名模型,登顶全球第一。

这两款模型的成功,背后是一条与众不同的技术路线。与行业主流依赖仿真或遥操作数据不同,灵初智能从一开始就坚定地押注“人类数据”进行训练。这条更贴近真实世界的高质量数据路径,为模型带来了更强的泛化能力。截至目前,公司已积累了近10万小时的人类操作数据,并开源了全球最大的人类手部操作全模态数据集。可以说,在人类数据这条赛道上,灵初智能已经占据了领先身位。

这一独特的技术选择近期也获得了国际资本的关注。5月7日,摩根士丹利在其发布的《人形机器人前沿报告》中,将灵初智能列为中国机器人“大脑阵营”的核心代表之一。

“我们的目标,是成为基于人类数据的具身大脑,在海外市场重塑具身智能的技术生态。”公司CEO王启斌这样阐述其愿景。

灵初智能CEO王启斌

率先押注“人类数据”

回顾具身智能的发展初期,业界在数据采集上主要有两种思路。一种是仿真模拟,即在虚拟环境中生成海量数据,成本低但真实性存疑。另一种是真机遥操作,数据真实,但本质是“机器教机器”,难以复现人类复杂的感知与纠错能力。

这两种方式都存在天然的局限。仿真数据难以模拟柔体、精细接触等复杂物理交互;而遥操作数据则缺失了人类决策与适应过程中的关键信息。问题的根源在于,它们都未能触及人类完成动作的核心机制。

人类执行一个物理任务,其实是一套精妙的闭环流程:观察环境、拆解步骤、尝试触碰、精细操作,并在过程中不断感知反馈、实时纠错。这背后是多感官协同与强大自适应能力的体现。

如果能将人类在这一流程中产生的视觉、触觉、位姿等多模态信息完整捕捉并记录下来,用于训练机器模型,那么模型就能真正“理解”人类的操作逻辑。这类数据,就是所谓的“人类数据”,它被视作训练通用具身模型最高质量的“原料”,但获取难度也最大。

灵初智能的联合创始人陈源培很早就洞察到了这一点。在2024年末的机器人顶会CoRL上,他明确提出,人类行为可以被捕捉并转化为机器人的训练数据。他早期利用人类手部数据进行模型训练的探索,也为公司坚定选择人类数据路线奠定了技术基础。

如今,灵初智能确立了以人类数据为核心、仿真数据为辅助的策略,并采用了“无本体数采”的方式——让人直接佩戴数据采集设备执行动作,从而获取最纯粹的人类操作数据。

为此,公司自主研发了全球首个灵巧手真实世界数采引擎Psi-SynEngine。当人类佩戴特制数据手套在真实劳动场景中工作时,系统能同步采集视觉、手部关节角度、触觉及腕部位姿等多模态数据。这些原始数据经过云端自动化管线的质检与处理后,便成为训练具身大脑的宝贵养料。

用人类数据训练模型的趋势正日益明朗。自2025年下半年起,越来越多的头部公司开始转向人类数据采集。而灵初智能凭借先发优势,已积累了近10万小时的人类手部操作多模态数据。今年的目标,是冲击100万小时——一个被认为能让模型能力发生质变的关键数据量级。

全球最大的开源 AI 社区 HuggingFace 上,由灵初智能开源的SynData 数据集冲上了 Trending 榜全球第一

王启斌表示,灵初智能希望成为“人类数据标准的制定者”,并正尝试通过开源推动行业共识的形成。“我们已经开源了全球最大的人类手部操作全模态数据集,首批开放1000小时。接下来,还将结合行业力量,共同推动相关评测基准的建设。”

基于10万小时“人类数据”的具身大脑

今年四月发布的Psi-R2和Psi-W0,正是基于上述10万小时人类数据训练而成的“具身大脑”双生子。在实际运作中,它们分工协作,共同完成复杂的决策与评估任务。

Psi-R2是一个策略模型,部署在机器人身上,负责执行具体动作。它是全球首个以10万小时量级人类数据预训练的世界模型,这也是其能在MolmoSpaces榜单上超越一众国际对手的关键。

Psi-W0则扮演着“仿真器”与“考官”的角色。它的核心功能是评估和优化R2的策略。当R2在W0模拟的物理环境中执行一个动作后,W0会计算出结果,并与预设目标进行比对。一致则判定成功,不一致则判定失败,并据此向R2提供反馈信号,驱动其调整策略。

这个过程可以类比为:机器人尝试将一根线束插入电脑的Type-C接口。最终状态是否符合预期,由W0来判定。如果失败,R2就在W0构建的虚拟环境里不断试错、进行强化学习,直到成功。

为了让模型更深刻地理解物理世界的边界与失败的可能性,灵初智能在训练W0时特意注入了30%的失败数据,教会它识别“什么情况下容易出错”。

这种将策略模型(R2)与仿真评估模型(W0)分离的架构,与行业主流的单模型设计思路不同。王启斌解释道,分离是因为两者的任务本质相悖:R2需要学习“成功是如何发生的”,因此其训练数据必须是成功案例;而W0要学习“世界的物理规律”并具备“反事实推演”能力,恰恰需要大量失败数据。

在模型能力的演进上,灵初智能设定了清晰的阶段性目标:今年年中,实现长程任务成功率40%-60%,并具备更强的zero-shot(零样本)泛化能力;到年底,将结合语言模态,让模型能够根据自然语言指令自主进行任务规划。

王启斌强调,公司的定位始终是“大脑公司”,所有硬件产品都是为模型能力服务的载体。例如,公司在2025年推出了拥有21个自由度的灵巧手ψ-SynHand,但这款产品并不单独出售。“我们最关心的不是灵巧手本身,而是模型的进展。”硬件,只是展示模型智能水平的舞台。

不只做“大脑”,还把数据做成生意

王启斌将公司的发展规划为三个阶段:硬件、数据、产品落地。目前,灵初智能正处在承上启下的“数据阶段”。

在灵初智能的蓝图里,数据不仅是训练模型的“燃料”,其本身就可以构成一种商业模式。公司已经开始向头部具身智能公司和基座模型公司供应人类视频数据及精细操作数据。“数据会成为基模公司和集成公司非常重要的输入。”王启斌指出。

然而,一个随之而来的问题是:当越来越多的公司开始自采人类数据时,灵初智能对外供应数据的独特优势何在?王启斌认为,优势恰恰源于公司自身训练模型的实践。正因为亲自用数据“喂养”和调教模型,才更深刻地理解什么样的数据最有价值、该如何采集和处理。这种对模型需求的深度认知,是其作为数据供应商的核心壁垒。

灵初智能的数据商业路径可以拆解为三个层次。

第一层,是工具层。公司自研的外骨骼数据采集手套,能将数据采集成本降至传统真机方案的十分之一。这套硬件本身就可以作为商品出售或租赁。

第二层,是数据层。依托已积累的近10万小时数据,覆盖294种场景、4821种任务、1382种物体,灵初智能直接向客户供应经过处理的优质数据集。

第三层,是方案层。公司提供“模型+灵巧手+数据服务”的整体打包解决方案。目前,其核心客户主要集中在两类场景:一是制造业的精密装配,如电子产品组装;二是物流行业的服装仓储拣选、分拨和打包。

这套商业模式能否跑通,关键在于“数据飞轮”能否真正转起来——即每在一个新场景落地,模型消耗的演示数据越来越少,而公司积累的场景数据却越来越多。从目前的进展看,这一趋势已得到验证:半年前,在物流场景部署一个新任务需要几百条真机演示数据,而现在不到100条就能完成。

基于对技术发展周期的判断,灵初智能认为,具身智能的竞争已经进入“数据浪潮”的下半场。当下的核心议题,不再是仿真与真机之争,而是比拼谁能用高质量的数据驱动“具身大脑”在真实场景中高效、可靠地落地。

从定义数据标准出发,灵初智能找到了自己的节奏。在如何将数据转化为商业价值,如何构建数据、模型与产品落地的正向闭环上,它已经摸索出一条可执行的路径。这或许正是灵初智能在日趋激烈的行业竞争中,试图构建的最深护城河。

来源:https://www.163.com/dy/article/KT9QHIUH05119C3G.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Excel跨工作表自动抓取数据方法详解
业界动态
Excel跨工作表自动抓取数据方法详解

在数据处理与分析领域,从多个Excel工作表中提取并整合信息是一项高频且关键的任务。传统手动操作不仅耗时费力,还极易出错。幸运的是,借助RPA(机器人流程自动化)技术,这一过程可以实现全自动化,显著提升数据抓取的效率与准确性,让员工从重复性劳动中解放出来,专注于更高价值的分析决策工作。 接下来,我们

热心网友
05.17
五万个代码仓库PR扫描揭示的安全修复真相
业界动态
五万个代码仓库PR扫描揭示的安全修复真相

在当今的软件开发实践中,安全团队识别安全漏洞的技术已相当成熟,但修复漏洞的效率却始终是普遍存在的瓶颈。问题的症结究竟在哪里?一项针对2025年超过5万个活跃代码仓库及400多家组织的深度研究,揭示了一个反直觉的结论:决定一个漏洞能否被成功修复的关键因素,往往并非其严重性等级,而是它被发现的**位置*

热心网友
05.16
Excel批量修改技巧与高效操作方法
业界动态
Excel批量修改技巧与高效操作方法

当您需要处理成百上千个Excel文件,并对其进行统一的格式调整、数据更新或内容替换时,手动逐个操作不仅效率低下,而且极易出错。如何实现像自动化流水线一样,一次性、精准地完成所有文件的批量处理?RPA(机器人流程自动化)技术提供了完美的解决方案。本文将详细介绍如何利用实在RPA,高效、零误差地完成Ex

热心网友
05.15
多个文件批量下载方法与技巧详解
业界动态
多个文件批量下载方法与技巧详解

当面临需要批量下载数十甚至数百个文件的繁琐任务时,手动操作不仅效率低下,还极易出错。此时,RPA(机器人流程自动化)技术便成为理想的解决方案。它如同一位不知疲倦的数字员工,能够精准模拟人类在计算机上的操作,自动执行重复性任务。本文将深入解析如何利用RPA实现高效的文件批量下载,并详细阐述其中的核心步

热心网友
05.15
批量搜索多个文件名的快速方法与技巧
业界动态
批量搜索多个文件名的快速方法与技巧

面对海量文件需要定位时,手动逐一查找不仅效率低下,还容易遗漏。幸运的是,借助实在RPA(机器人流程自动化)技术,我们可以轻松构建一个自动化批量文件搜索方案。本文将详细介绍如何从零开始搭建这一高效流程,帮助您快速掌握文件批量搜索的自动化技巧。 一、准备工作 在开始自动化流程设计前,需要完成两项基础准备

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Mac清理Safari自动填充记录教程 保护苹果隐私安全
系统平台
Mac清理Safari自动填充记录教程 保护苹果隐私安全

在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过

热心网友
05.19
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题
系统平台
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题

你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整

热心网友
05.19
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南
系统平台
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南

如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏

热心网友
05.19
Mac关闭Spotlight索引的详细步骤与禁用设置技巧
系统平台
Mac关闭Spotlight索引的详细步骤与禁用设置技巧

当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围

热心网友
05.19
Mac清理Microsoft Teams缓存详细步骤指南
系统平台
Mac清理Microsoft Teams缓存详细步骤指南

当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓

热心网友
05.19