首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
谷歌开源平台Coral NPU:全天候运行大模型的穿戴设备方案

谷歌开源平台Coral NPU:全天候运行大模型的穿戴设备方案

热心网友
31
转载
2025-10-16

谷歌今天可谓是双喜临门。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

一边是与耶鲁大学合作,基于Gemma研发的Cell2Sentence-Scale 27B(C2S-Scale)首次预测出全新的潜在癌症疗法,在科研界掀起热议;另一边则重磅升级了视频生成模型Veo 3.1,为用户带来电影级画面质感——具体可参阅报道《刚刚,谷歌Veo 3.1迎来重大更新,硬刚Sora 2》。

更值得关注的是,他们还同步推出了专为低功耗设备设计的Coral NPU,让AI能在智能手表等穿戴设备上持续运行。具体而言,这款处理器可在可穿戴设备上流畅运行小型Transformer模型和大语言模型,通过IREE和TFLM编译器完美支持TensorFlow、JAX及PyTorch三大主流框架。

与前两项成果一样,这款处理器的发布同样在开发者社区引发了热烈讨论。

Coral NPU:专为边缘设备打造的全栈开源AI平台

谷歌将Coral NPU定位为“一个全栈式开源平台,致力于解决性能、碎片化和隐私这三大核心挑战——正是这些因素制约了功能强大、始终在线的AI技术在低功耗边缘设备和可穿戴设备上的应用。”

这意味着,借助Coral NPU,未来我们有望打造出能在智能手表等设备上本地持续运行的高性能AI应用,让智能体验真正融入用户的日常生活场景。

然而要实现这一愿景并不容易。谷歌总结了三大技术瓶颈:

性能差距:复杂先进的机器学习模型需要更多计算资源,这远超市面上边缘设备有限的功率预算、散热能力和内存容量。

碎片化成本:为多样化的专属处理器编译和优化机器学习模型既复杂又昂贵,这阻碍了跨设备实现一致性能的愿景。

用户信任缺失:要想真正发挥作用,个人AI必须优先保障个人数据和情境隐私的安全性。

而今天发布的Coral NPU延续了其最初的Coral项目理念,“为硬件设计师和机器学习开发者提供了构建下一代私密、高效边缘AI设备所需的工具链。”

具体而言,Coral NPU是谷歌研究院与DeepMind联合设计的成果,是一个AI优先的硬件架构,专门用于支持下一代超低功耗、始终在线的边缘AI应用。

它提供统一的开发者体验,使部署环境感知等应用变得更为简便。该架构专为在可穿戴设备上实现全天候AI而设计,在最大限度减少电池消耗的同时,还能通过灵活配置适应更高性能的应用场景。

谷歌已发布完整的技术文档和工具包,方便开发者和设计人员立即着手原型开发。

项目主页:https://developers.google.com/coral

代码库:https://github.com/google-coral/coralnpu

架构设计解析

从命名便可知,Coral NPU采用神经处理单元架构,为构建下一代高能效、针对机器学习优化的片上系统提供了完整的模块化解决方案。

该架构基于符合RISC-V指令集标准的IP模块,专为最低功耗场景设计,使其成为环境感知应用的首选方案。

其基础设计能在仅消耗几毫瓦功率的情况下,提供512 GOPS级别的性能,从而为边缘设备、耳戴式设备、AR眼镜和智能手表带来强大的端侧AI能力。

Coral NPU生态系统全景图,展示了为SoC设计师和机器学习开发者提供的端到端技术栈。

这种基于RISC-V的开放且可扩展架构,为SoC设计师提供了充分的灵活性,使他们既能修改基础设计,也能将其作为预配置的NPU核心使用。

Coral NPU架构包含以下核心组件:

标量核心:一个轻量级、支持C语言编程的RISC-V前端,负责管理流向后端核心的数据流。它采用简单的“运行到完成”执行模型,在实现超低功耗的同时,兼容传统CPU功能。

向量执行单元:一个强大的单指令多数据协处理器,完全符合RISC-V向量指令集规范,能够对大型数据集进行同步操作。

矩阵执行单元:一个高效的量化外积乘积累加引擎,专为加速神经网络的基本运算而构建。请注意,该矩阵执行单元仍在开发中,将于今年晚些时候在GitHub上正式发布。

从传统设计到Coral NPU的架构演进示意图。

统一的开发者体验

Coral NPU架构是一个简洁的、支持C语言编程的目标平台,能够与现代编译器工具链无缝集成。这使得它能够轻松支持TensorFlow、JAX和PyTorch等主流机器学习框架。

Coral NPU包含完整的软件开发工具链,其中包括针对TensorFlow的TFLM编译器解决方案,以及通用的MLIR编译器、C语言编译器、自定义内核和模拟器。这为开发者提供了灵活的集成路径。

例如,来自JAX等框架的模型会首先通过StableHLO方言导入为MLIR格式。这个中间文件随后被送入IREE编译器,该编译器会加载识别Coral NPU架构的硬件专用插件。随后,编译器将执行渐进式降级——这是一个关键的编译步骤,在此过程中代码会通过一系列方言被系统地转译,逐步接近机器的本地语言。优化完成后,工具链会生成一个紧凑的最终二进制文件,以便在边缘设备上高效执行。

下表直观展示了Coral NPU的软件开发优势:

来源:https://36kr.com/p/3511522467601541
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

小米电视:以创新科技与贴心设计,打造家庭影院新体验的优选之品
科技数码
小米电视:以创新科技与贴心设计,打造家庭影院新体验的优选之品

智能家居赛道激战正酣,小米电视凭何赢得消费者青睐? 如今的智能家居市场,早已是一片红海。各方势力角逐之下,小米电视却悄然跃升为许多家庭选购清单上的重要选项。从沉浸式的家庭影院到酣畅淋漓的游戏娱乐,它凭借一套覆盖多元场景的产品组合,其市场表现值得深入一探。 核心优势:一张覆盖全场景的产品网 说起小米电

热心网友
04.17
王者万象棋女娲出装攻略
游戏攻略
王者万象棋女娲出装攻略

王者万象棋女娲最强出装与实战手法全攻略 在《王者万象棋》的激烈对抗中,决定一位英雄上限的往往不只是其技能机制,更在于能否通过精准的装备搭配,将她的核心能力彻底解放。女娲正是如此,一套契合版本的出装方案,是她掌控全场节奏、奠定胜局的核心保障。 王者万象棋女娲怎么出装 要让女娲的远程消耗与爆发控制能力全

热心网友
04.17
c语言函数递归 实操经验总结:这些技巧很实用
编程语言
c语言函数递归 实操经验总结:这些技巧很实用

深入理解C语言递归的核心原理与工作机制在C语言编程中,递归是一种强大的编程范式,指函数直接或间接调用自身来解决问题。掌握递归的关键在于领悟其核心思想:将复杂的原始问题,逐步分解为结构相似但规模更小的子问题,直至子问题简化到能够直接求解的基线条件。这一过程主要包含两个不可或缺的组成部分:递归基(出口)

热心网友
04.17
xbox one 游戏 实际使用记录与经验整理
游戏资讯
xbox one 游戏 实际使用记录与经验整理

Xbox One的硬件体验与日常维护作为一款已进入生命成熟期的游戏主机,Xbox One在长期使用中展现出了其设计的稳定性。其机身设计相对宽大,这为内部散热提供了一定空间,但也意味着在电视柜中需要占据不小的位置。在长时间游戏后,机身会排出温热空气,这属于正常现象,保持良好的通风环境至关重要,避免将主

热心网友
04.17
如何在合约交易中利用“一目均衡表(IKH)”判断长线趋势?
web3.0
如何在合约交易中利用“一目均衡表(IKH)”判断长线趋势?

如何在合约交易中利用“一目均衡表(IKH)”判断长线趋势? 判断长线趋势,从来不是单凭一两个信号就能拍板的。它更像是一个系统工程,需要多个维度的证据相互印证。说到这,就不得不提一目均衡表(IKH)这套经典工具。它之所以在趋势交易者中备受推崇,正是因为它提供了一套环环相扣的验证逻辑。 一目均衡表长线趋

热心网友
04.17