首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
安谋科技新一代NPU IP如何赋能终端AI应用爆发

安谋科技新一代NPU IP如何赋能终端AI应用爆发

热心网友
87
转载
2026-05-27

2025年,端侧AI的浪潮正以前所未有的速度席卷全球科技产业。从售价下探至299美元的Meta Ray-Ban AI智能眼镜,到智能手机拍照的实时AI优化、汽车自动驾驶的本地化决策,这些前沿应用的背后,都指向一个共同的核心挑战:对端侧AI SoC芯片算力与能效比的极致追求。在此背景下,上游半导体IP厂商的技术创新,正成为驱动这场“芯”变革的关键引擎。

在近期于上海张江举办的一场端侧AI技术研讨会上,安谋科技(中国)有限公司高级产品经理叶斌分享了行业洞察。他指出,端侧AI已从早期的概念验证阶段,步入规模化商业落地的关键前夜。安谋科技自主研发的“周易”NPU(神经网络处理器)IP,正致力于驱动终端算力实现关键性跃迁,助力中国芯片产业把握这一历史性机遇。

端侧大模型参数持续攀升,安谋科技DSA架构赋能芯片极致能效

当前,主流端侧设备所能承载的AI大模型参数规模,上限大约在100亿(10B)级别。反观Meta最新开源的Llama 3系列模型,其参数已涵盖80亿、300亿乃至700亿等多种规格。这清晰地揭示了一个产业趋势:未来,复杂的数据训练与通用性更强的超大参数模型将集中于云端完成,而终端设备则专注于运行经过剪枝、量化等轻量化处理后的精炼模型。这种“云边协同”的分工模式优势显著——能够带来更低的响应延迟、更强的个性化适配能力,以及天然的隐私数据安全保护。

从旗舰手机、高性能平板到智能汽车座舱和AI PC,硬件平台快速迭代,对AI SoC提出了明确且统一的要求:采用多核异构设计并持续提升算力,已成为不可逆转的技术主流。

随着技术演进,计算的重心必然向更高效、更专业的架构倾斜,以在峰值性能、功耗与成本之间找到最佳平衡点,从而支撑起大模型及各类AI应用的广泛部署。在此背景下,专为特定计算领域设计的DSA(领域专用架构),依然是端侧AI芯片追求极致能效比和面积效率的必然选择。通过NPU IP与其他处理单元的多核协同与算力融合来实现整体性能突破,正成为技术破局的核心路径。

安谋新一代周易NPU IP支持高精度浮点运算,前瞻布局未来应用场景

为应对未来更复杂的端侧AI计算挑战,安谋科技推出了新一代自研“周易”NPU IP。其在核心架构设计上持续针对Transformer模型进行深度优化,同时兼顾传统CNN卷积网络在超分辨率等场景的加速需求。更为关键的是,公司投入重兵完善其软件工具链与开发生态,不断丰富和扩展算子库,旨在高效支持大语言模型(LLM)的轻量化部署与实时响应,以敏捷满足AI PC、高端智能手机、智能座舱及高级驾驶辅助系统(ADAS)等新兴端侧应用场景的苛刻需求。

大模型要提升其对复杂语境的理解与生成能力,扩大上下文窗口(Context Window)和序列长度是必然的技术路径。这对AI处理器的内部架构设计提出了新课题:必须对计算单元、存储带宽及数据流进行精心的全局考量与平衡。

端侧AI的发展始终面临算力、内存带宽和功耗能效这三重挑战。从应用与底层算力匹配的角度看,存储技术的演进至关重要。目前,LPDDR5X内存能够支撑端侧10B以下参数模型的流畅运行,主要覆盖手机、平板和PC;汽车智能座舱的模型也大致在这一量级;而物联网(IoT)设备的模型则更小、更轻量。未来,随着存储技术向LPDDR6标准演进,预计端侧设备可承载的AI模型容量与复杂度将提升50%以上。

大模型的最终落地,是一个算法创新与硬件平台“双向奔赴”的协同过程。随着更低比特位宽(如INT4、FP8)的量化算法日益成熟,在保证模型精度的同时,其体积得以进一步压缩,最终使得参数量更大的模型部署在资源受限的端侧成为可能。行业预测,未来两到三年,参数规模在200亿至400亿的AI大模型出现在高端端侧设备上,将逐渐成为现实。

趋势已然明朗:端侧AI应用对算力的需求呈指数级增长,且所需计算精度正从CNN时代的INT低精度整数运算,转向需要更高表达能力的FLOAT浮点运算。为此,新一代周易NPU进行了全面架构升级,支持从INT4、INT8、INT16到BF16、FP16、FP32的多数据类型混合运算。在硬件设计上充分考虑了计算单元的能效复用,并致力于通过片上缓存优化减少片外内存的数据搬运,通过专用硬件加速模块来提升整体效率。针对长上下文序列处理场景,其AI加速模块得到了针对性增强;同时,多任务并行执行的QoS(服务质量)调度技术也进行了强化,以确保多样化的端侧AI应用都能获得稳定、流畅的实时体验。

AI大模型对内存带宽提出了前所未有的高要求,同时计算的核心也在从传统的卷积操作向注意力机制偏移。结合端侧部署大模型的具体诉求,采用专用NPU并追求极致的能效比和面积效率,是当前市场的最优解。通过引入多层次智能缓存系统和优化的硬件流水线结构,使数据尽可能在计算单元附近完成处理,能显著降低因频繁数据搬运所带来的巨额功耗开销。

在端侧AI设备加速普及、AI SoC设计热潮涌动的双重推动下,半导体IP的战略价值与产业地位日益凸显。安谋科技采取了灵活的IP授权与合作模式,全面覆盖从硬件架构到软件栈的完整解决方案。除了先进的DSA架构,NPU配套的软件生态同样至关重要。公司继承了ARM在移动计算领域的深厚基因,为“周易”NPU IP配备了一套成熟、完整的软件工具链,包括最新的GPU协同量化工具、动态形状识别支持以及持续维护的开源模型库。通过持续加大投入完善算子库,凭借软硬件深度协同的系统级创新,新一代周易NPU IP有望更好地满足新兴端侧AI应用的多元化与高性能需求,为终端用户带来兼具强大算力与超低功耗的卓越体验。

来源:https://m.elecfans.com/article/6807722.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

安谋科技新一代NPU IP如何赋能终端AI应用爆发
AI资讯
安谋科技新一代NPU IP如何赋能终端AI应用爆发

2025年,端侧AI的浪潮正以前所未有的速度席卷全球科技产业。从售价下探至299美元的Meta Ray-Ban AI智能眼镜,到智能手机拍照的实时AI优化、汽车自动驾驶的本地化决策,这些前沿应用的背后,都指向一个共同的核心挑战:对端侧AI SoC芯片算力与能效比的极致追求。在此背景下,上游半导体IP

热心网友
05.27
代号“峨眉”的安谋科技Arm China新一代“玲珑”VPU IP来了:CAE加持下编码质量提升20%,码率最大降低80%
业界动态
代号“峨眉”的安谋科技Arm China新一代“玲珑”VPU IP来了:CAE加持下编码质量提升20%,码率最大降低80%

安谋科技发布新一代VPU IP “玲珑”V560 V760:AI视频时代的“六边形战士” 国内领先的芯片IP设计与服务提供商安谋科技(中国)有限公司,近日在上海举办了一场名为《玲珑·视界》的开年技术发布会。会上,其面向AI应用的新一代VPU IP——“玲珑”V560 V760(代号“峨眉”)正式亮相

热心网友
04.15
安谋科技发布新一代VPU IP:玲珑系列实现AI视频处理新突破
科技数码
安谋科技发布新一代VPU IP:玲珑系列实现AI视频处理新突破

随着人工智能技术的快速发展,视频数据量呈现爆发式增长,从视频会议、直播互动到智能驾驶、机器视觉,越来越多的场景对视频处理能力提出更高要求。3月24日,安谋科技(中国)有限公司(Arm China)在

热心网友
03.26
安谋自研CPU亮相,性能与生态布局解析
电脑教程
安谋自研CPU亮相,性能与生态布局解析

ARM今日宣布首款自产芯片将助力人工智能生态创新,所提供的高效能AGI CPU为那些谋求自主硬件平台的伙伴另辟蹊径:Meta将作为首席合作伙伴与联合研发单位利用安谋AGI CPU构建基础设施,志在进

热心网友
03.25
安谋科技新主场:探索AI与芯片IP的落地路径
科技数码
安谋科技新主场:探索AI与芯片IP的落地路径

1月16日,安谋科技(中国)有限公司在上海西岸智塔AI Tower举行“上上迁”乔迁仪式,正式启用全新办公空间。此次乔迁不仅是办公场所的迁移,更被业内视为安谋科技在中国人工智能(AI)与半导体产业布

热心网友
01.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

宏指令录制教程:一键自动化重复操作步骤详解
AI资讯
宏指令录制教程:一键自动化重复操作步骤详解

如果你在使用QoderWake数字员工时,经常重复执行“查日志、过滤ERROR、导出最近1小时”这类固定流程,却尚未掌握宏指令功能,那么你的工作效率仍有巨大提升空间。效率瓶颈通常源于未能将指令组合有效绑定,或未正确触发宏录制机制。实现重复操作的一键自动化其实很简单,只需掌握五个核心步骤:启用宏录制、

热心网友
05.27
AI预览画板内容如何提升设计师工作效率
AI教程
AI预览画板内容如何提升设计师工作效率

一、AI如何快速预览画板内容:原理与价值解析 人工智能技术正深度融入各行各业,其应用场景持续拓展。其中,利用AI对画板内容进行智能预览与分析,已成为提升工作效率的重要实践。这项功能看似基础,却能切实帮助设计师、项目管理者及广大用户节省时间、优化决策流程。 AI预览技术在各行业的具体应用场景 AI技术

热心网友
05.27
时空猎人觉醒攻略:从入门到精通的养成指南
游戏攻略
时空猎人觉醒攻略:从入门到精通的养成指南

在《时空猎人觉醒》中,角色养成需系统化推进:通过主线任务升级解锁技能,强化装备、镶嵌宝石以提升战力。合理分配技能点,培养宠物获得加成,利用强化与符文系统增强属性。参与活动获取稀有资源,组队副本学习技巧,完成日常积累资源。养成需随版本动态调整,多维度投入方能打造强力角色。

热心网友
05.27
币安Web3交易所:引领未来金融革命的先锋平台
web3.0
币安Web3交易所:引领未来金融革命的先锋平台

币安与Web3 0的深度融合 当区块链技术以惊人的速度迭代,下一代互联网——Web3 0的轮廓也日益清晰。它描绘的,是一个去中心化、用户真正掌控数据、价值自由流动的新世界。在这场深刻的变革中,币安交易所凭借其前瞻性的布局和强大的执行力,已然成为探索与实践Web3 0理念的先锋。那么,币安究竟是如何借

热心网友
05.27
高通徐晧解析6G试验频率如何平衡覆盖与带宽
AI资讯
高通徐晧解析6G试验频率如何平衡覆盖与带宽

工信部批复6GHz频段用于6G试验,为关键技术攻关提供支撑。该频段在覆盖与带宽间取得更好平衡,利于降低部署成本。6G研发聚焦超大规模MIMO、子带全双工及通感一体化等方向,旨在提升频谱效率并融合通信感知能力。目前3GPP已启动6G系统研究,首个标准版本计划于Release21发布,预计2030年前后实现商用。

热心网友
05.27