首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
“周易”X3技术锦囊:应对端侧AI算力、内存、功耗三大瓶颈

“周易”X3技术锦囊:应对端侧AI算力、内存、功耗三大瓶颈

热心网友
90
转载
2025-12-18

大模型正加速从云端向边缘与端侧渗透,然而,算力、内存、功耗等瓶颈却成为制约其规模化落地的“高墙”。专为AI计算而生的神经网络处理器(NPU),正是打破这堵墙的关键。安谋科技推出的“周易”X3 NPU IP,通过架构创新、软硬件协同优化与开放生态等手段,为应对端侧AI面临的“算力墙”、“内存墙”、“功耗墙”三大困境,提供了全面而先进的技术锦囊。

端侧AI“三堵墙”困境,“周易”X3给出技术锦囊



锦囊一:应对“算力墙”,从“定点”到“浮点”,架构升级与算力灵活配置

端侧AI正从CNN架构向Transformer迁移,对高精度浮点运算的需求激增。传统NPU受限于架构适应性差、算力调度效率低等问题,难以满足复杂AI场景的动态需求。为应对大模型对端侧算力的严苛要求,“周易”X3提供了高效的解决方案。

“周易”X3的核心破局之道在于底层架构革新,它采用专为大模型而设计的DSP+DSA全新架构,实现了从定点计算向浮点计算的跨越,能够同时兼容CNN与Transformer模型,解决了传统NPU架构“偏科”的痛点。单个计算簇可提供8至80 FP8 TFLOPS的灵活算力配置,能精准匹配不同场景下的多样化算力需求。与上一代产品相比,“周易”X3实现了显著的性能升级——AIGC大模型能力提升高达10倍,CNN模型性能提升30%至50%,充分释放了大模型的算力潜能。

锦囊二:应对“内存墙”——高带宽与智能存储,提升内存利用效率

大模型参数量庞大,内存带宽与存储压力是另一大瓶颈。若无法高效处理数据读写与存储,将导致AI任务卡顿与响应延迟。“周易”X3通过多重技术升级应对内存挑战:

超高数据通道:单核心带宽高达256GB/s,能快速完成海量数据的读写,减少数据在内存中的滞留时间。计算核心带宽相比上一代提升4倍,可保障数据高效传输;智能存储架构:升级的L2 Memory存储系统能有效减少对DDR的访问频率,提升数据吞吐效率;硬件解压引擎:集成自研的解压缩硬件模块WDC,使大模型的权重参数经软件无损压缩后,通过硬件解压能额外获得约15%的等效带宽;低精度加速模式:支持端侧大模型运行必备的W4A8/W4A16计算加速模式,兼顾存储容量、带宽与精度需求,在保证模型效果的前提下显著提升计算效率。实测数据显示,多核算力的线性度达70-80%、大模型Prefill阶段利用率可达72%、Decode阶段有效带宽利用率突破100%,充分验证了其卓越的内存调度能力与系统协同优化表现。

锦囊三:应对“功耗墙”:极简调度与按需供给,实现能效优化

终端设备在有限的电池容量和散热条件下,亟需通过算力与能效的协同优化,实现高性能AI任务与长久续航的平衡。

“周易”X3集成了AI专属的硬件调度引擎AIFF,搭配专用硬化调度器,能将CPU负载降至0.5%以下,且调度延迟极低。NPU在处理多项AI任务时,无需依赖CPU频繁介入调度,显著降低了CPU与NPU间的通信开销,从而降低系统功耗、有效延长设备续航时间。

此外,“周易”X3采用可扩展的多核架构及层次化的内部互连架构,支撑算力的灵活裁剪和扩展,系统可根据AI任务复杂度实现“按需供能”,有效降低无效计算与数据迁移,实现能源利用效率最大化。

Compass AI软件平台 —— 助力全链路高效开发与部署

应对端侧AI“三堵墙”挑战,离不开软硬件的深度协同。“周易”X3配套的Compass AI软件平台凭借完善易用、开放生态、安全保障等多维优势,成为应对端侧AI“三堵墙”困境的“金牌辅助”。



“周易” NPU Compass AI软件平台

Compass AI软件平台提供端到端统一工具链,可实现“一键部署,开箱即用”。它原生支持Hugging Face、主流AI框架与操作系统,支持超过160种算子及270种模型,并对LLM/VLM/VLA及MoE等大模型推理进行深度优化,实现从CNN到Transformer模型的无缝接入,大幅降低模型部署门槛与成本。同时,平台对量化算法的支持与具备的动态Shape能力,可在提升性能的同时有效降低功耗,避免无效计算。

此外,Compass AI软件平台提供多种软件工具,并开放IR规格、开源量化工具等核心组件。开发者可基于DSL编程语言,通过丰富的NN编译器插件实现自定义算子,配合可视化调试工具,能够实现全链路可观、可优化,极大提升不同场景下的开发效率,为端侧AI的算力调度、功耗控制提供底层软件支撑。

以自研IP产品矩阵 ,助推端侧AI规模化落地

在安谋科技“AI·Arm·CHINA”战略指引下,公司将以AI为核心、Arm®生态为支撑、本土创新为根基,持续推进“周易”NPU、“星辰”CPU、“山海”SPU和“玲珑”多媒体处理器四大自研IP产品的研发,与产业伙伴协同共建中国智能计算生态,助推端侧AI的规模化落地。

来源:https://www.163.com/dy/article/KH2LTM2K0511RIVP.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

CPU-Z 2.20 新版发布 支持 AMD Gorgon Halo 系列处理器
科技数码
CPU-Z 2.20 新版发布 支持 AMD Gorgon Halo 系列处理器

CPU-Z发布2 20版本,显著扩展了对新一代处理器的识别支持,包括AMD锐龙PRO9000、锐龙AI400G系列及代号“GorgonHalo”的多款高端型号,以及英特尔相关平台。同时,新版本新增了对HUDIMM和HSODIMM等前沿内存模组的识别能力。

热心网友
05.15
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕
游戏评测
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

据外媒报道,近期发生了一件可能是最离谱的“捡漏”故事,不过这种运气可不是人人都有。 最近在Reddit上,一位用户的经历让整个硬件圈都直呼“离谱”。他在一家本地的清仓店里,只花了6 99美元,就成功拿下了一套64GB的DDR5笔记本内存(2×32GB)。 价格错误的“捡漏”故事之前也听过不少,比如半

热心网友
04.29
内存价格狂泻!DDR5最高降22%:创下四个月新低
科技数码
内存价格狂泻!DDR5最高降22%:创下四个月新低

日本DDR5内存价格“跳水”,但市场迷雾仍未散 最近,日本PC硬件市场传来一个值得玩味的消息:多款DDR5内存套装价格在4月中旬出现了显著松动,部分型号的降幅甚至超过了20%。这波降价,是市场回归理性的信号,还是又一次短暂的波动? 主流规格领跌,高频型号跟进 先看具体数据。根据市场监测,32GB(1

热心网友
04.25
又一游戏机官宣涨价!新机涨100刀 翻新机更夸张
游戏评测
又一游戏机官宣涨价!新机涨100刀 翻新机更夸张

内存危机引发硬件涨价潮,Meta官宣Quest系列调价 一场由内存(RAM)供应紧张引发的连锁反应,正在消费电子市场掀起波澜。继索尼、微软之后,Meta也正式加入了涨价行列。公司今日宣布,自4月19日起,将对旗下Quest系列虚拟现实头显的售价进行全面上调。 具体来看,这次调价覆盖了多个产品线: M

热心网友
04.24
采购价近乎翻倍:消息称苹果砸重金狂买三星 12GB 内存,只为首款折叠手机 iPhone Fold
科技数码
采购价近乎翻倍:消息称苹果砸重金狂买三星 12GB 内存,只为首款折叠手机 iPhone Fold

采购价近乎翻倍:消息称苹果砸重金狂买三星12GB内存,只为首款折叠手机iPhone Fold 行业风向标终于有了新动向。来自韩媒The Bell的最新报道显示,苹果的首款折叠屏手机iPhone Fold,已经进入了量产备货的冲刺阶段。这不,为了保障核心零部件的供应,苹果已经开始向三星大量订购12GB

热心网友
04.23

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

华硕枪神10X发布 搭载9950X3D与全息光显风扇
科技数码
华硕枪神10X发布 搭载9950X3D与全息光显风扇

华硕在ROGDAY2026上发布了枪神10X整机,首次搭载三颗可联动显示的全息光显风扇,外观极具未来感。其核心配置顶级,采用AMD锐龙99950X3D2处理器、ROGRTX5080显卡、64GB内存及4TBSSD,并配备高效三区独立散热系统,定价69999元。

热心网友
05.16
鹿客V3 Max智能门锁发布 支持4米远距离无线充电
科技数码
鹿客V3 Max智能门锁发布 支持4米远距离无线充电

智能门锁领域迎来重磅新品。知名品牌鹿客近期于京东平台正式发售其旗舰型号V3 Max智能门锁,该产品凭借创新的隔空无线充电技术与先进的AI视觉识别系统引发市场关注。官方定价为3572元,在部分参与促销活动的地区,消费者可享受补贴,最终入手价有望低至2799元,性价比优势显著。 鹿客V3 Max在视觉安

热心网友
05.16
华硕ROG魔霸10系列游戏本发布 搭载9955HX3D与RTX 5070 Ti
科技数码
华硕ROG魔霸10系列游戏本发布 搭载9955HX3D与RTX 5070 Ti

在备受瞩目的ROG DAY 2026广州站活动中,华硕重磅发布了其新一代高性能游戏笔记本电脑——ROG魔霸10系列。该系列包含16英寸的魔霸10与屏幕更大的18英寸魔霸10 Plus两款机型,旨在为硬核玩家带来顶级的游戏体验。 ROG魔霸10系列的硬件配置堪称顶级。处理器方面,用户最高可选择搭载AM

热心网友
05.16
小米手环10 Pro配置曝光 双灯组双PD传感器升级详解
科技数码
小米手环10 Pro配置曝光 双灯组双PD传感器升级详解

5月15日,小米官方正式公布了小米手环10 Pro的完整配置信息。作为新一代旗舰手环,它在健康监测精准度、运动功能专业度以及佩戴舒适度上均实现了显著突破,为用户带来了更全面的智能穿戴体验。 小米手环10 Pro 健康监测:精度与维度的双重跃升 本次升级的核心在于健康监测能力的全面进化。小米手环10

热心网友
05.16
金士顿推出新款FURY Renegade Pro DDR5 RDIMM内存散热马甲
科技数码
金士顿推出新款FURY Renegade Pro DDR5 RDIMM内存散热马甲

金士顿扩展其可超频的ECCRDIMM内存系列,新增高达7600MT s型号。其中高速型号采用全新铝制散热马甲,提升散热效率以保障高负载下的稳定运行。该系列同时支持ECC校验与超频,兼顾性能与数据完整性,适用于AI计算、工程仿真等高要求专业场景。

热心网友
05.16