随着韩国股市在三天内上演“过山车”般的剧烈波动,投资者的神经也随之紧绷起来。一些市场人士指出,剧烈震荡的股价正不断敲打着股民们敏感的神经。
这一系列波动的背后,源自上周五美股收盘后的一则传闻。有消息称,英伟达计划在当地时间3月15日举行的GTC大会上,发布一款专为推理计算打造的全新平台。据悉,这个新平台将采用芯片初创公司Groq设计的专用芯片。
随着中东局势在上周末再度紧张,韩国股市在周一休市后,周二、周三连续遭遇重挫,三星电子与SK海力士的股价累计下跌幅度均接近20%。除了地缘冲突的影响外,市场分析中似乎也出现了另一种声音,认为内存巨头的暴跌或许与“Groq抢占了HBM的市场前景”有关。

(三星电子与SK海力士在周四均出现强劲反弹)
这样的担忧真的有必要吗?
要知道,英伟达去年底曾斥资约200亿美元,获得了芯片初创公司Groq的核心技术团队及非独占专利授权。这也是英伟达首次在核心算力芯片领域,大规模引入外部的先进芯片架构。
引发部分三星与海力士股东焦虑的关键,正是Groq自主研发的LPU(语言处理单元)芯片。该芯片的核心特点在于片上集成了数百兆容量的SRAM。由于SRAM的访问速度比HBM快约二十倍,通过减少甚至完全绕过外部存储访问,该芯片能够实现极低延迟的语言模型推理输出。
随着英伟达年度发布会日益临近,“Groq是否会冲击HBM市场”的话题再度被市场热议:如果推理芯片的技术路线从依赖HBM堆料转向片上SRAM,存储巨头的生意岂不是要遭受冲击?
作为这一猜测的佐证,OpenAI在上周五宣布获得英伟达等机构约300亿美元融资时,曾专门强调将从该公司采购大量“专用推理算力”,暗示了这款新型处理器的存在。
英伟达首席执行官黄仁勋也表示,将在GTC上发布一款“世界前所未见”的全新芯片。市场普遍猜测,如果这款芯片并非下一代Rubin架构的旗舰GPU产品,那么极有可能是以SRAM为核心的LPU推理芯片。
那么,这两种芯片真的构成替代关系吗?
对于市场上关于SRAM将“取代”HBM的说法,韩国科技分析师Jukan在周四开盘前援引独立分析机构KIS的研究报告指出,此类观点反映对存储器原理的理解尚不充分。
分析报告称,相比DRAM,SRAM单个体元面积更大、存储密度较低。在相同容量下,使用SRAM所需的芯片面积可能是DRAM的5到10倍,这在实际生产中极大限制了其在芯片上的规模扩展。也正因如此,SRAM历来被用于对延迟要求极高的高速缓存或片上缓冲应用中,而非作为存储海量数据的主存储器。
因此,与其说它会替代GPU,这类芯片更适合作为特定推理任务的补充选择,例如对延迟要求极为苛刻的物理AI边缘应用(机器人和自动驾驶),而不是直接取代HBM或DRAM。
事实上,英伟达CEO黄仁勋在今年1月的CES分析师问答环节中也详细解释过这一点。
黄仁勋表示,理论上当然可以把所有东西都放进SRAM里,那样就不再需要HBM内存了。但其核心限制在于:能够放进这些SRAM里的模型规模,也同时被限制在大约100倍以内。而实际的工作负载形态一直在变化,有时会遇到MoE模型,还有多模态模型等,因此英伟达需要提供更具普适性的综合解决方案。
黄仁勋也指出,对于某些特定工作负载而言,SRAM的运行速度可能“快得惊人”,因此在预填充阶段和解码阶段能看到一些显著优势。
