8月28日讯 - NVIDIA年度重磅新品GB10 Grace Blackwell超级芯片的发布时间虽略有推迟,但这颗被视为NVIDIA进军桌面CPU市场的破冰之作(笔记本领域对应N1系列)终于揭开面纱。
近日NVIDIA官方正式公布了GB10芯片的技术细节,特别指出这是与联发科深度合作的结晶。
其实今年年初NVIDIA首次展示代号Project DIGITS(后定名DGX Spark)的桌面迷你AI工作站时,就透露了联发科在CPU架构和互连技术上的重要贡献。
从技术规格来看,GB10采用台积电3nm制程工艺和2.5D封装技术,整体架构分为CPU内存模块(S-dielet)和GPU模块(G-Dielet)两大部分。
CPU部分搭载20个Armv9.2架构核心,采用双集群设计(10+10),每个核心配备独立二级缓存(容量未公开),每组集群共享16MB三级缓存。
GPU部分基于Blackwell架构,虽未明确公布CUDA核心数量,但预计达到6144个(相当于RTX 5070级别),集成第五代Tensor核心、24MB二级缓存,支持光线追踪和DLSS4技术,FP32单精度浮点性能31TFLOPS,NVFP4算子性能高达1000TOPS。
CPU与GPU之间采用基于NVLink总线架构的C2C高速互联通道。
额外配置16MB系统级缓存(可作为CPU四级缓存),显著提升了不同计算单元间的数据共享效率。
内存规格为256位宽的LPDDR5X统一内存,最高频率9400MHz,理论带宽约301GB/s。
整芯片热设计功耗高达140W,运行基于DGX Base OS深度定制的系统,目前尚不支持其他Linux发行版或Windows on Arm。
根据NVIDIA官方数据,在128GB内存配置下,GB10可流畅运行2000亿参数的AI大模型,或700亿参数的微调模型。
若通过ConnectX-7总线互联两组DGX Spark系统,最高可支持4050亿参数的模型运算。
