时间:2025-09-22 作者:游乐小编
9月18日,华为全联接大会2025正式召开,华为轮值董事长徐直军在会上重磅发布了昇腾芯片的演进路线图与未来规划。
徐直军详细介绍了华为未来三代的昇腾芯片布局,包括即将问世的昇腾950PR、950DT以及后续的960、970系列。其中昇腾950PR芯片预计在2026年第一季度正式上市,该款产品最大的亮点是首次采用了华为自主研发的HBM技术。
根据官方披露的技术指标,昇腾950PR芯片在设计上实现了多项突破:新增支持FP8/MXFP8/HIF8低精度数据格式,其中FP8类计算能力达1PFLOPS,MXFP4算力达2PFLOPS;对向量运算能力进行了重点强化;互联带宽提升2.5倍;同时搭载华为自研的HiBL 1.0和HiZQ 2.0两版HBM高带宽内存解决方案。
具体规格显示:HiBL 1.0版本内存容量128GB,带宽达到1.6TB/s;HiZQ 2.0版本则进一步提升至144GB容量和4TB/s带宽。
在应用场景方面,采用950核心配合HiBL 1.0内存的昇腾950PR芯片将重点增强推理任务中的Prefill(预填充)性能,大幅提升推荐系统的业务表现。而降搭载HiZQ 2.0内存的昇腾950DT则着眼于提升推理Decode(解码)性能、训练效率以及内存带宽的各项指标。
技术背景解读:
在大模型推理过程中,Prefill阶段需要处理完整的输入数据并构建计算缓存,这一关键环节对芯片算力有着极高要求。由于Prefill阶段更依赖运算性能而非内存带宽,因此特别适合采用HBM架构的芯片处理。
HBM(高带宽内存)采用创新的3D堆叠技术,通过垂直集成多层DRAM芯片,使数据传输效率得到质的飞跃。这种内存技术具备超低延迟、超高带宽、高容量密度和卓越的能效比等优势,是处理AI密集型任务的理想选择。
美国国际战略研究中心AI专家Gregory Allen指出,在高性能AI芯片中,HBM技术的价值占比通常高达50%,是现代AI芯片不可或缺的核心组件。
随着AI模型规模不断扩大,推理过程需要实时调用数百亿甚至上千亿参数。HBM技术使GPU能够直接访问完整模型参数,有效解决了传统DDR内存带宽不足导致的算力闲置问题。特别是在处理超大规模AI模型时,HBM技术能显著改善系统响应速度。
目前在高性能AI计算领域,HBM几乎已成为训练芯片的标准配置,在推理芯片市场的渗透率也随着模型复杂度的提升而快速增长。
2021-11-05 11:52
手游攻略2021-11-19 18:38
手游攻略2021-10-31 23:18
手游攻略2022-06-03 14:46
游戏资讯2025-06-28 12:37
单机攻略