在具身智能领域,数据问题始终是一块难以逾越的巨石——大模型与自动驾驶均已拥有较为成熟的数据方案,唯有具身智能领域,长期在“数据从何而来、如何应用”这一环节上徘徊不前。灵初智能最新发布的解决方案,或许正在为这一困境打开突破口。
今日,灵初智能正式宣布:全球首个具身原生人类数据采集方案 Psi-SynEngine 亮相。这并非一个概念或演示文稿,而是一套完全自主研发的完整体系,涵盖62+自由度便携式外骨骼触觉手套数采套装、大规模野外(in the wild)数据采集管线,以及基于世界模型与强化学习的跨本体数据迁移模型。更为关键的是,该方案已在物流等真实场景中落地,同步发布了覆盖视觉、语言、触觉、动作的大规模真实世界多模态数据集 Psi-SynNet-v0。这意味着:真实世界的具身数据引擎,已经正式启动运转。

Psi-SynEngine|全场景野外采集方案

Psi-SynEngine|大规模室内部署数据采集展示
数据困境:三条传统路径,各有明显短板
回顾行业内现有的数据采集方法,每一条路径都伴随显著的局限性。
首先是仿真环境数据采集。Sim-to-Real 的差距极为突出——仿真环境与真实作业场景之间的分布差异,直接导致策略迁移效果大打折扣。调参成本高昂、场景搭建耗时费力,更关键的是,某些物体根本无法仿真,例如布料等柔性材料,现有物理仿真器几乎无能为力。
第二种是机器人遥操作数据采集。该方案面临的核心问题是——规模化难以实现。行业内充斥着零星的试点项目,缺乏统一标准,更不必谈成熟的运营机制。数据多样性也很难保障,雇佣专人反复采集,成本居高不下,效率却难以提升。更现实的是,不可能将全球所有场景、所有物体、所有操作都搬进数据采集场复刻——成本无法承受。
第三种是 UMI 设备数据采集。双夹爪的性能天花板显而易见——大量真实落地场景所需的精细操作根本无法完成。美国劳工部数据显示:工厂中 98.7% 以上的工序需要双手多指协同完成。双夹爪在本质上存在局限。
Psi-SynEngine 的破局逻辑:直接采用人类手部数据
灵初智能的 Psi-SynEngine 思路非常直接——不再费力搭建高成本、低保真度的采集场地,而是让一线作业人员在真实工作中直接采集操作数据。采集场景覆盖物流、工厂、商超、酒店、家庭,数据本身源自真实场景,无需额外进行二次迁移。
这一方向与灵初智能创立时的战略选择一脉相承——他们从一开始就锚定通用灵巧操作。相比其他机器人硬件形态,灵巧手与人手之间的形态差异最小,数据迁移效率自然最高。
与传统方案相比,Psi-SynEngine 具有三点突出优势:
- 成本低——便携式采集设备大幅降低部署门槛,数据获取成本仅为真机遥操作方案的十分之一。
- 多模态高自由度——触觉、视觉、动作、语言的操作数据均可完整采集,所有操作细节得以保留。
- 便携性强——随需部署,支持大规模并行采集,效率远超其他方案。
这些特性使 Psi-SynEngine 成为业内首个真正具备规模化部署能力的具身数据引擎。灵初智能因此能够以前所未有的速度和规模积累真实世界的具身数据资产。

视觉、语言、触觉、动作数据可视化展示
硬件与平台:支撑引擎运转的核心底座
仅有采集思路并不足够,灵初智能为这套引擎配备了完整的硬件与平台体系。他们自主研发了专为数据采集设计的外骨骼触觉手套,定位精度最高可达亚毫米级别,能够完整采集手部与手臂所有自由度,同时覆盖全手触觉信息——最关键的是,不会影响作业人员的正常操作。此外,自主搭建的支持大规模数据处理的管线与平台,结合自研大模型实现高精度标注与后处理,形成了完整的数据生产闭环。
数据集 Psi-SynNet-v0 的四大特征
基于这套引擎,灵初智能发布的 Psi-SynNet-v0 数据集具备四个显著特征:
- 数据多样性强——覆盖多行业、多场景、多物体、多技能的真实操作,有效打破了数据多样性壁垒,大幅提升模型迁移与泛化能力。
- 模态覆盖全面——视觉、语言、触觉、动作等多维度全真值数据均包含在内,为预训练阶段的模态对齐提供有力支撑。
- 数据规模海量——数据量级已达到大语言模型同级水平,为具身智能未来发展留出充足想象空间。
- 自闭环已验证——该数据体系已在灵初多个落地产业中完成闭环验证。依托模型的强大能力,确保采集的数据高度匹配算法需求,持续推动模型迭代。
真正的护城河:将人类数据“翻译”给机器人
整套方案中,最核心的并非硬件本身,也不是采集流程的优化——而是如何将人类数据真正应用于机器人操作。其中最难的一关在于:人手与灵巧手之间,结构和能力天然存在差异。如何弥合这个鸿沟?
灵初智能早在 2023 年就开始攻克这一难题。他们已成功将人手数据迁移到不同自由度的灵巧手上,并完成了相同的操作——相关成果与演示均已发布。如今,这项技术被迅速工程化,演变为基于世界模型、强化学习和触觉模态对齐的完整解决方案。它能有效解决人类与不同机器人之间的跨本体差异(embodiment gap),大幅提升模型泛化性与成功率。这,才是 Psi-SynEngine 真正不可复制的核心优势。

人类数据驱动|分拨真实展示、物流分拣、商超打包、3C与电子真实展示
新范式确立:向百万小时级数据集进发
Psi-SynEngine 与 Psi-SynNet-v0 的发布,标志着灵初智能基于人类真实操作数据的具身智能新范式已然落地。这也意味着,真实世界的具身 AI 大模型预训练终于具备了可规模化的实现路径。目前,依托这套引擎,灵初智能已在内部构建了上万小时规模的 Psi-SynNet-v0 数据集,并计划在明年突破百万小时量级——这将成为全球最大的灵巧操作数据集,也是训练真正具身原生大模型的核心资产。灵初智能诚邀全球研究机构与合作伙伴携手共建 Psi-SynNet,共同开启通用智能新时代。
