近期,边缘AI领域迎来一项备受瞩目的合作:芯原股份与谷歌联合推出了面向边缘AI的Coral NPU IP,专为始终在线、超低功耗的大语言模型端侧部署场景设计。该IP基于谷歌在开放机器学习编译器领域的基础研究成果,并针对AI安全特性进行了深度强化。简而言之,谷歌贡献了工具链与编译器的技术积累,芯原则负责将技术转化为可落地的芯片级解决方案——双方联手,旨在为开发者打造一个统一的开源平台,从而加速边缘AI生态的构建。

从技术层面来看,Coral NPU以RISC-V开放指令集架构为根基,并在此之上引入了原生张量处理能力。这意味着什么?开发者可以自由穿梭于主流的机器学习框架之间——JAX、PyTorch、TensorFlow Lite(TFLite)均能获得原生支持。在编译器方面,它采用基于开放标准的工具,例如来自LLVM项目的多级中间表示(MLIR)。整个设计的方向十分明确:聚焦始终在线、超低能耗的边缘AI应用。哪些场景才是它的主战场?可穿戴设备、泛在感知系统——这些对功耗和实时性要求严苛的领域,正是这款NPU发挥核心价值的舞台。
值得关注的是,Coral NPU IP已在谷歌开发者网站开源,面向全球开发者开放。与此同时,芯原将提供商业化的企业级IP版本,结合自身在芯片设计、验证以及系统级优化方面的深厚经验,为客户提供一站式定制服务。目前,基于Coral NPU IP的验证芯片正在开发中,目标应用直指AI/AR眼镜和智能家居。简言之,这些终端设备正是大模型落于边缘端的最前沿战场——谁能率先实现量产,谁就能占据先机。
芯原执行副总裁、定制芯片平台事业部总经理汪志伟在谈及此次合作时提到:“本次项目基于我们在Open Se Cura开源项目上的既有经验,也标志着谷歌开源技术与芯原在芯片设计及产业化支持上的持续深度合作。”他还进一步指出,芯原接下来将持续强化在芯片设计、验证与系统级优化方面的优势,助力开源技术真正落地到终端产品中去。行业并不缺乏技术方案,真正稀缺的是能够串联起开源技术、芯片设计能力和量产支持的中间力量——芯原想要扮演的,恰恰就是这个角色。
