先说几个核心判断——在2026年的CES展会期间,声网联合博通集成发布了一款新产品:基于 BK7259 芯片的“R2 全场景AI机器人开发套件”。而陆吾智能旗下的“陆卡卡”,作为该方案在桌面机器人场景的标杆产品,也同步在展会上亮相。

从现场来看,陆卡卡在声网兄弟公司 Agora 的展位前,吸引了不少目光。
从R1到R2:完成“能听会说”到“能看会动”的关键跨越
去年3月,声网 R1 开发套件发布时,就引起了不少的关注。珞博智能的“芙崽Fuzozo”成了R1的首批客户。在京东2025年6·18大促期间,Fuzozo 在 AI 玩具竞速榜中表现相当亮眼——旗下“金木水火土”五个款式,直接占据了当天竞速榜的前六位。市场对Fuzozo的广泛认可,已经证明了R1套件的实力与市场潜力。

今年CES上,芙崽也出现在了声网兄弟公司 Agora 的展位。
这次推出的R2套件,则是在R1基础上的技术、功能全面升级——这标志着声网端侧 AI 交互能力,从“能听会说”正式跨入了“能看会动”的新阶段。
R2完整继承了R1系列业界领先的全双工对话、背景降噪、流畅打断等实时AI语音交互能力。在此基础上,又新增了几个突破性的功能:
·本地视觉识别与处理能力:得益于BK7259芯片集成的NPU与ISP,R2现在可以自己完乘人脸跟踪、手势识别、物体跟随等复杂操作。实时交互的边界,从此从“语音”扩展到了“视觉”。
·实现具身互动,让机器人更具“活人感”:R2支持多自由度运动控制,配合视觉与语音功能,能实现“走到用户面前打招呼”、“转头注视说话者”这类富有生命感的情感化肢体交互。这样的互动,才更像是人与人之间的交流。

展会上,陆卡卡、Lookee、Choochoo、小匠等多家合作伙伴的产品,也都在现场进行了联合展示。
定义“全场景”:一套基座,赋能多元硬件创新
R2 的能力边界,当然不是只停留在桌面机器人上。它的设计初衷,就是为了给那些需要融合“感知-决策-动作”的AI硬件,提供一套标准化的参考方案。说白了,就是给各类创新硬件,准备一个经过验证、可以快速适配的端侧多模态AI解决方案:
·教育陪伴场景:可以作为智能学习助手,实现绘本识别、指尖点读,甚至坐姿提醒。
·办公协作场景:化身会议助理,支持发言人跟踪与实时纪要生成。
·家居交互场景:成为视觉中控,通过注视唤醒、手势控制联动全屋设备。
·穿戴记录场景:作为轻量AI记录仪,自动捕捉并结构化生活片段。
提供一站式方案 助力企业专注“体验”打造
R2套件的发布,对于创业者和开发者来说,产品化的路径会被大幅缩短。过去需要痛苦地整合多方技术,现在R2套件直接提供了一站式的“交钥匙”方案。企业开发的核心精力,可以从“如何实现”转移到“如何创造更打动人心的体验”上面来。
对于产业链而言,这也为芯片、传感器、结构件等上下游伙伴提供了明确的研发与市场方向,降低了整个行业的创新风险与试错成本。
声网期待越来越多的创新者,能基于R2这一经过验证的技术基座,共同推动端侧AI硬件进入一个百花齐放的产品时代。
