

近日有消息称,日本正计划研发新一代超级计算机FugakuNEXT,预计在2030年投入使用。该超算将拥有当前顶级AI系统百倍的运算能力,其中很大程度依赖于NVIDIA未来两代GPU的技术支持。
在人工智能领域成为全球科技竞争焦点的背景下,日本也在积极布局,力图避免在未来关键技术上受制于人,即便目前可以采购到最先进的AI计算硬件,日本仍在推进自主研发。
为此,日本不仅继续使用NVIDIA的GPU产品,也在同步开发具备竞争力的本土AI加速芯片。这项研发聚焦于定制化浮点运算加速技术,目标是实现与NVIDIA产品相媲美的性能。
由日本NEDO资助的Pezy Computing KK公司正承担这一芯片的研发任务。该公司自2012年推出首款Pezy芯片以来,持续迭代升级。在近期举办的Hotchips 25会议上,该公司正式发布了Pezy-SC4系列芯片,预计将于明年上市。
根据相关技术资料显示,Pezy-SC4将采用台积电5nm制程工艺,芯片面积为555.7mm²,集成48亿个晶体管,配备2048个计算核心,基础频率1.5GHz,内置64MB L3缓存,搭配96GB HBM3内存,整体功耗控制在600W。
性能方面,其FP64浮点运算峰值可达24.6TFLOPS,FP32为49.2TFLOPS,FP16则达到98.4TFLOPS。
未来,该公司还将推出更先进的Pezy-SC5系列,采用台积电3nm工艺,芯片面积扩大至785mm²,晶体管数量达100亿,核心数提升至4096组,并搭载192GB HBM3e内存,功耗为900W。该系列还将新增对FP8格式的支持,FP64性能进一步提升至329.6TFLOPS,全面适配AI计算需求。
从能效角度来看,Pezy-SC3与SC4在FP64下的能效分别为41.9和41 GFLOPS/W,SC5预计将达到45.8 GFLOPS/W。相较之下,目前NVIDIA H200的FP64能效为47.9 GFLOPS/W,B200为33.3 GFLOPS/W,而专为AI优化的B300则仅为0.89 GFLOPS/W,主要因其FP64性能已大幅缩减。
综合来看,日本企业研发的这一系列芯片在整体性能上已具备与国际顶尖GPU竞争的实力,同时在FP64到FP8等多精度计算方面均有良好支持,尤其在高精度计算领域体现出更强优势。
