SK海力士近期推出了一项名为H3的混合存储架构技术方案,该方案融合了高带宽内存(HBM)与高容量缓冲内存(HBF)两类存储介质的核心优势。相比之下,HBF具备更高的存储密度,但存取延迟较高,且写入持久性相对受限。
在物理结构层面,图形处理器通过先进中介层与HBM基础芯片实现互连;该HBM芯片内部集成专用控制器及延迟隐藏缓冲模块,并进一步经由同一中介层与HBF基础芯片相连。整套互联逻辑针对大语言模型推理任务进行了优化,尤其适配依赖共享式预计算键值缓存的工作模式。
基于仿真环境的对比测试表明,在面向大规模只读数据的大语言模型推理场景下,H3混合架构相较于纯HBM配置系统,在单位性能成本比方面展现出显著提升。
