广和通VLA端侧推理加速2.6倍让机器人更流畅_AI热点日报

广和通VLA端侧推理加速2.6倍让机器人更流畅

类型：热点整理2026-07-05

广和通AI研究院基于自研FiboVLA压缩框架和端侧推理优化技术，实现主流VLA模型平均2 6倍推理加速，成功将GR00TN1 5部署至边缘侧高算力平台，并在LIBERO仿真数据集和桌面双臂真机环境中完成验证，为具身智能机器人端侧高效运行奠定基础。

广和通AI研究院近日在具身智能领域取得重大突破——依托自主研发的FiboVLA框架与端侧推理优化技术，团队在多个主流VLA模型上成功实现平均2.6倍的推理加速，并将GR00T N1.5顺利部署至边缘侧高算力主控平台。相关成果已在LIBERO仿真基准数据集及桌面双臂真机环境中完成验证，为具身智能模型在机器人端侧高效运行奠定了坚实基础。

让机器人动作更流畅！广和通实现VLA端侧推理2.6倍加速

参数规模爆炸式增长，端侧实时推理成机器人落地瓶颈

VLA——即视觉-语言-动作模型，是具身智能领域的关键技术方向。该模型将视觉输入、语言指令与动作生成三者融合，使机器人能够依据环境信息与任务指令实时产生行动。设想虽好，挑战却随之而来：VLA能力越强，模型参数规模与推理成本也越高。对机器人而言，推理速度直接决定了动作响应的及时性、任务衔接的顺畅度以及整体运行效率。

此外，机器人本身受限于算力、功耗、散热及系统资源等条件。如何让复杂的VLA模型在端侧高算力主控上稳定、高效运行，已成为具身智能落地必须跨越的核心障碍。

FiboVLA：巧压缩视觉Token，优化推理全链路

解决方案何在？广和通AI研究院自研FiboVLA压缩框架，从模型语义层入手，对Token进行精细化优化。在VLA推理过程中，视觉与语言信息中包含大量冗余表征。FiboVLA通过筛选与压缩视觉Token，剔除低价值信息，仅保留与任务理解、环境判断及动作生成紧密相关的核心内容。

这样一来，推理过程中的无效计算大幅减少，同时模型的决策精度、跨模态理解能力与动作生成能力几乎不受影响——计算负载却显著下降。结合推理链路调度与端侧推理引擎优化，整体效率进一步提升。关键在于，该框架不依赖特定模型架构，已在多个主流前沿VLA模型上验证有效，推理吞吐量提升2.6倍，端到端时延也控制在极紧凑范围内。

打通“大模型+小终端”的最后一公里

此次突破的核心价值，在于让原本对算力要求极高的VLA大模型，终于能够稳定融入机器人端侧系统运行。依托FiboVLA框架与端侧推理优化技术，广和通AI研究院已将GR00T N1.5部署至边缘侧高算力主控平台，并顺利完成运行验证。

在LIBERO仿真基准数据集中，推理加速后的任务效果未出现下降；在真实物理环境中，桌面双臂机器人场景下GR00T N1.5的真机运行验证同样顺利通过。这意味着，机器人如今能够在端侧更快速地完成感知、决策与动作生成，形成低延迟、连续化的推理闭环——这不仅是模型速度的提升，更是在真实机器人平台上完成的一次扎实工程验证。

从推理加速迈向机器人“本能”反应

FiboVLA框架的成功落地，为广和通AI研究院在端侧AI与具身智能方向积累了一套核心能力，涵盖模型压缩、推理引擎优化、机器人平台验证及系统协同。面向具身智能加速发展的产业趋势，广和通正将无线通信、边缘算力、AI工具链与Fibot平台能力深度整合，助力机器人与各类智能终端获得更高效、更稳定的本地智能。这为具身智能真正进入真实系统运行，迈出了坚实一步。

来源：https://m.elecfans.com/article/8057002.html

机器人

延伸阅读

补充最近整理过的热点入口。