1月1日,智元具身研究中心正式发布第二代一体化具身大小脑系统GenieReasoner。该系统聚焦于解决视觉-语言-动作模型中的语义推理与动作控制之间的模态对齐难题,创新性地设计了一套支持统一离散化预训练的模型架构,并通过引入流匹配技术,有效缓解了传统离散化方法在动作生成中的精度局限。
为了更准确地评估具身体在真实环境中的推理能力,研究中心同步推出了ERIQ——一个专注于真实机器人操作全流程的具身推理评测基准。ERIQ能够对VLA模型中不同维度的推理能力进行解耦与量化分析,为技术迭代提供可靠依据。
实验结果显示,GenieReasoner在多项推理任务中达到当前最优水平,且在跨本体的真实机器人测试中展现出卓越的泛化能力。进一步对比验证表明,模型具身推理能力的提升能显著增强其端到端动作执行效果,充分体现了ERIQ基准评估的有效性。
未来,研究团队将围绕“逻辑深度”与“执行精度”两大方向持续优化,推动具身大小脑、世界模型与真实环境强化学习之间的闭环融合。目前,ERIQ Benchmark已全面开源,相关项目信息可通过最新平台获取。
