具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2.0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实体运行数据。

野村国际于6月28日发布的研究报告中,详细记录了分析师实地走访宇树的见闻。在演示环节中,搭载了WVLA2.0系统的G1机器人,于一个存在干扰的会议室环境下,无需任何远程遥操作,自主完成了六项连续性任务。其中最关键的数据是,其推理闭环用时仅为约90毫秒,相当于每秒可迭代近十次。这是宇树耗费两年时间打磨出的产品版本,也是首个具备实际商业部署潜力的型号。管理层明确表示,最早落地的应用场景将聚焦于工业制造领域,例如关节电机装配、上下料以及工装夹具处理等。而宇树最核心的资产,则是其全球机器人机队在运行过程中沉淀的大规模实体数据。
该报告同样梳理了NXP在COMPUTEX 2026上公布的NeuralAxis架构框架。此框架由NXP首席执行官拉斐尔·索托马约尔主导提出,其核心主张与宇树的实际工程路径高度契合。简而言之,物理AI的真正瓶颈并不在于大语言模型的规模或推理能力的强弱,而在于是否能构建一个类似于人类脊髓反射机制一样的边缘控制层——其延迟可低至40毫秒,且所有处理均在本地完成。
对于投资者而言,这传递的信号非常清晰:具身智能的竞争格局,正在从“谁的模型更强”转向“谁的系统更完整”。宇树凭借全栈自研的整合能力,叠加实体数据的独特优势,构建起了一道让纯云端模型公司难以逾越的壁垒。
NeuralAxis:重新定义物理AI的系统架构边界
NXP的NeuralAxis框架颇具巧思,它直接借鉴了人类的神经系统作为设计蓝本。整个物理AI的控制逻辑被划分为三个层级:最高层是推理层,类比于大脑皮层,延迟约为300毫秒;中间层是协调层,负责运动控制与平衡维持,功能类似于小脑;最底层是反射层,模拟脊髓功能,其延迟可低至40毫秒,并可直接部署在靠近执行器的边缘端。
对于人形机器人而言,这一框架的影响尤为深远。NeuralAxis主张采用分布式的反射处理器来取代传统的集中式中央大脑。具体而言,在机器人的关节、手部、脚部等关键部位,均部署具备本地自主决策能力的单元,使得握力控制、踝关节平衡等动作能够在本地即时完成,并且在40毫秒内就能实现平衡、抓取、姿态及步态的链式恢复。这种推理与运动控制的解耦,意味着机器人在持续学习新技能时,能够同时保持运动稳定性,避免了顾此失彼的问题。
该框架的商业前景同样值得关注。野村的行业调研显示,相比传统自动化方案,NeuralAxis架构能够带来显著的制造效率提升,且诊断机器人的销量也有望实现大幅增长。此外,同一套架构还能将无人机的端到端延迟压缩至20毫秒以内,甚至可以将软件定义汽车的控制逻辑,按层次合理分配给推理、协调与安全关键区域去执行。
WVLA2.0:模型融合与软硬件协同的落地路径
宇树的WVLA2.0所采取的技术路线,与行业主流方案存在明显差异。大多数同类方案都押注于纯VLA(视觉-语言-动作)的端到端生成模式,而WVLA2.0则另辟蹊径,它将WMA模型的预测能力与VLA的动作生成能力融合在一起。这一设计使得系统在高层次任务理解、2D/3D空间语义推理、受动力学约束的动作生成以及抗干扰能力方面,均实现了全面升级。
在感知层面,系统融合了四路并行的视觉流:一个RealSense深度相机、一个Livox MID360激光雷达,以及两个侧向摄像头。这使其能够构建出360度的空间表征,在干扰条件下,位置更新的延迟可控制在10毫秒以内。在软硬件协同设计方面,推理完成后产生的动作参数通过CAN总线发送至G1机器人具备23个自由度的关节,再借助宇树自研的“小脑”运动控制模块,当单臂抓取2公斤以下物体时,其定位误差可控制在5毫米以内。
在计算架构上,WVLA2.0将边缘算力需求压缩至100 TOPS以下,完全运行在G1 EDU搭载的NVIDIA Jetson Orin NX平台上,无需依赖云端服务器。管理层解释道,这样做的好处在于,可以有效规避因网络延迟或连接中断而引发的任务中断风险。
数据范式转移:“无本体采集”成主流
报告中另一个非常重要的信号是数据采集模式的转变。宇树的演示表明,在单次录制过程中无需人工遥操介入,G1机器人便能在受干扰的环境中自主完成连续的多任务操作。这意味着“无本体数据采集”正逐渐成为具身智能数据生产的主流范式——机器人依靠自身的感知与决策系统来积累数据,而非依赖工人通过手柄遥控操作来进行标注。
当然,野村的行业调研也指出了现阶段存在的一些局限性:系统仍存在盲区及后向感知的不足,执行速度相对偏慢,精细操作的精度也有待提升,并且还缺乏量化的持续成功率基准测试数据。这些短板恰恰划定了近期商业落地的边界。
因此,管理层规划的落地策略是分阶段进行的:最早落地的领域是工业制造,例如关节电机装配、上下料、工装夹具处理等,因为宇树拥有自己的工厂,可以形成完整的数据闭环;随后是物流分拣与柔性3C装配;而家庭与医疗护理场景,由于其环境开放、非结构化程度高、实施难度大,被列为更长远的发展目标。
全栈整合:宇树差异化壁垒的两个维度
野村报告的核心结论,归根结底可以概括为一句话:在具身智能商业化的进程中,模型能力固然重要,但它绝不是唯一决定性的变量。
宇树管理层将公司的差异化竞争力总结为两个层面:第一是涵盖感知、模型到运动控制的全栈自研整合能力;第二是依托全球机器人机队所积累的大规模实体运行数据。这两项资产能够相互强化——自研硬件产生独占的数据,而数据反过来又哺育模型的迭代,最终形成一个良性的闭环。对于纯做云端模型的公司而言,这个闭环是很难突破的。
从市场竞争格局来看,NeuralAxis框架与WVLA2.0的落地逻辑指向了同一个结论:具身智能的核心战场,正在系统架构层与数据层同时展开。对于投资者来说,评估赛道参与者的维度,必须从单一的“模型能力”扩展到更全面的系统整合能力以及实体数据的积累规模上。
