广和通AI研究院近日在具身智能领域取得重大突破——依托自主研发的FiboVLA框架与端侧推理优化技术,团队在多个主流VLA模型上成功实现平均2.6倍的推理加速,并将GR00T N1.5顺利部署至边缘侧高算力主控平台。相关成果已在LIBERO仿真基准数据集及桌面双臂真机环境中完成验证,为具身智能模型在机器人端侧高效运行奠定了坚实基础。

参数规模爆炸式增长,端侧实时推理成机器人落地瓶颈
VLA——即视觉-语言-动作模型,是具身智能领域的关键技术方向。该模型将视觉输入、语言指令与动作生成三者融合,使机器人能够依据环境信息与任务指令实时产生行动。设想虽好,挑战却随之而来:VLA能力越强,模型参数规模与推理成本也越高。对机器人而言,推理速度直接决定了动作响应的及时性、任务衔接的顺畅度以及整体运行效率。
此外,机器人本身受限于算力、功耗、散热及系统资源等条件。如何让复杂的VLA模型在端侧高算力主控上稳定、高效运行,已成为具身智能落地必须跨越的核心障碍。
FiboVLA:巧压缩视觉Token,优化推理全链路
解决方案何在?广和通AI研究院自研FiboVLA压缩框架,从模型语义层入手,对Token进行精细化优化。在VLA推理过程中,视觉与语言信息中包含大量冗余表征。FiboVLA通过筛选与压缩视觉Token,剔除低价值信息,仅保留与任务理解、环境判断及动作生成紧密相关的核心内容。
这样一来,推理过程中的无效计算大幅减少,同时模型的决策精度、跨模态理解能力与动作生成能力几乎不受影响——计算负载却显著下降。结合推理链路调度与端侧推理引擎优化,整体效率进一步提升。关键在于,该框架不依赖特定模型架构,已在多个主流前沿VLA模型上验证有效,推理吞吐量提升2.6倍,端到端时延也控制在极紧凑范围内。
打通“大模型+小终端”的最后一公里
此次突破的核心价值,在于让原本对算力要求极高的VLA大模型,终于能够稳定融入机器人端侧系统运行。依托FiboVLA框架与端侧推理优化技术,广和通AI研究院已将GR00T N1.5部署至边缘侧高算力主控平台,并顺利完成运行验证。
在LIBERO仿真基准数据集中,推理加速后的任务效果未出现下降;在真实物理环境中,桌面双臂机器人场景下GR00T N1.5的真机运行验证同样顺利通过。这意味着,机器人如今能够在端侧更快速地完成感知、决策与动作生成,形成低延迟、连续化的推理闭环——这不仅是模型速度的提升,更是在真实机器人平台上完成的一次扎实工程验证。
从推理加速迈向机器人“本能”反应
FiboVLA框架的成功落地,为广和通AI研究院在端侧AI与具身智能方向积累了一套核心能力,涵盖模型压缩、推理引擎优化、机器人平台验证及系统协同。面向具身智能加速发展的产业趋势,广和通正将无线通信、边缘算力、AI工具链与Fibot平台能力深度整合,助力机器人与各类智能终端获得更高效、更稳定的本地智能。这为具身智能真正进入真实系统运行,迈出了坚实一步。
