黄仁勋澄清英伟达LPU新品会否挤压HBM市场
随着韩国股市在三天内上演“过山车”般的剧烈波动,投资者的神经也随之紧绷起来。一些市场人士指出,剧烈震荡的股价正不断敲打着股民们敏感的神经。
这一系列波动的背后,源自上周五美股收盘后的一则传闻。有消息称,英伟达计划在当地时间3月15日举行的GTC大会上,发布一款专为推理计算打造的全新平台。据悉,这个新平台将采用芯片初创公司Groq设计的专用芯片。
随着中东局势在上周末再度紧张,韩国股市在周一休市后,周二、周三连续遭遇重挫,三星电子与SK海力士的股价累计下跌幅度均接近20%。除了地缘冲突的影响外,市场分析中似乎也出现了另一种声音,认为内存巨头的暴跌或许与“Groq抢占了HBM的市场前景”有关。

(三星电子与SK海力士在周四均出现强劲反弹)
这样的担忧真的有必要吗?
要知道,英伟达去年底曾斥资约200亿美元,获得了芯片初创公司Groq的核心技术团队及非独占专利授权。这也是英伟达首次在核心算力芯片领域,大规模引入外部的先进芯片架构。
引发部分三星与海力士股东焦虑的关键,正是Groq自主研发的LPU(语言处理单元)芯片。该芯片的核心特点在于片上集成了数百兆容量的SRAM。由于SRAM的访问速度比HBM快约二十倍,通过减少甚至完全绕过外部存储访问,该芯片能够实现极低延迟的语言模型推理输出。
随着英伟达年度发布会日益临近,“Groq是否会冲击HBM市场”的话题再度被市场热议:如果推理芯片的技术路线从依赖HBM堆料转向片上SRAM,存储巨头的生意岂不是要遭受冲击?
作为这一猜测的佐证,OpenAI在上周五宣布获得英伟达等机构约300亿美元融资时,曾专门强调将从该公司采购大量“专用推理算力”,暗示了这款新型处理器的存在。
英伟达首席执行官黄仁勋也表示,将在GTC上发布一款“世界前所未见”的全新芯片。市场普遍猜测,如果这款芯片并非下一代Rubin架构的旗舰GPU产品,那么极有可能是以SRAM为核心的LPU推理芯片。
那么,这两种芯片真的构成替代关系吗?
对于市场上关于SRAM将“取代”HBM的说法,韩国科技分析师Jukan在周四开盘前援引独立分析机构KIS的研究报告指出,此类观点反映对存储器原理的理解尚不充分。
分析报告称,相比DRAM,SRAM单个体元面积更大、存储密度较低。在相同容量下,使用SRAM所需的芯片面积可能是DRAM的5到10倍,这在实际生产中极大限制了其在芯片上的规模扩展。也正因如此,SRAM历来被用于对延迟要求极高的高速缓存或片上缓冲应用中,而非作为存储海量数据的主存储器。
因此,与其说它会替代GPU,这类芯片更适合作为特定推理任务的补充选择,例如对延迟要求极为苛刻的物理AI边缘应用(机器人和自动驾驶),而不是直接取代HBM或DRAM。
事实上,英伟达CEO黄仁勋在今年1月的CES分析师问答环节中也详细解释过这一点。
黄仁勋表示,理论上当然可以把所有东西都放进SRAM里,那样就不再需要HBM内存了。但其核心限制在于:能够放进这些SRAM里的模型规模,也同时被限制在大约100倍以内。而实际的工作负载形态一直在变化,有时会遇到MoE模型,还有多模态模型等,因此英伟达需要提供更具普适性的综合解决方案。
黄仁勋也指出,对于某些特定工作负载而言,SRAM的运行速度可能“快得惊人”,因此在预填充阶段和解码阶段能看到一些显著优势。
相关攻略
知名爆料博主曝光了三星GalaxyZFold8Wide折叠手机的钢化膜照片,展示了新机可能的外屏轮廓。结合示意图生成的渲染图直观呈现了大致形态,但最终真机边框不会如渲染图般极致窄,且屏幕将保留前置摄像头挖孔。
三星一项卷轴屏手机专利被曝光,设备可通过手动拉伸机身扩展屏幕面积。专利包含两种方案,其中一种可使屏幕在闭合时完全隐藏以增强保护。设备内置传感器以识别拉伸状态,确保显示内容自适应。目前仅为专利构想,未必会量产,但为未来手机形态提供了新思路。
五月初,三星电子的一则公告,在中国消费电子市场激起了不小的波澜——公司决定在中国大陆市场停止销售电视、显示器等全品类家电产品。消息一出,各种解读纷至沓来。但若仔细审视其全球战略布局便会发现,这并非一次简单的“撤退”,而是一次清晰的“聚焦”。三星并非离开中国,而是正在以另一种更深入的方式,重新锚定其在
三星推出新款奥德赛G8游戏显示器,包括全球首款32英寸6K165HzMiniLED型号,支持一键切换至3K330Hz模式。同场亮相的还有27英寸5K180Hz版本。OLED产品线同步更新,推出采用新QD-OLED技术的27与32英寸4K240Hz型号,均获VESAHDR认证。此外,定位更亲民的32英寸4K165HzOLEDG7也一同发布。三星目前占据全球OL
三星电子与工会达成暂定协议,避免了大规模罢工。协议核心是为半导体部门设立特别绩效奖金,按营业利润的10 5%计提且不设上限,旨在激励员工。此前劳资谈判僵持约五个月,威胁全球供应链稳定。该协议尚待工会成员投票批准,若通过将为行业处理劳资关系提供参考。
热门专题
热门推荐
MiniCPM-o 4 5是什么 在探索更自然、更智能的人机交互道路上,我们始终在期待一个“全能型选手”的到来。如今,这个角色或许已经登场。面壁智能最新开源的MiniCPM-o 4 5,一个仅拥有90亿参数的全模态大模型,正致力于重新划定“智能对话”的边界。 它彻底颠覆了传统一问一答的“对讲机”式交
Binance币安 欧易OKX ️ Huobi火币️ 想在2025年安全获取欧易OKX的正版APP?其实秘诀就一个:认准官方网站,避开所有仿冒和可疑的下载渠道。要知道,欧易现已统一更名为欧易OKX,其核心业务始终围绕数字资产交易及相关服务展开。 确认官方网站地址 第一步,打开浏览器,手动输入欧易OK
SecondMe Book是什么 在AI社交这一前沿赛道,一款国产平台正带来独特的解决方案。SecondMe Book,本质上是一个能够让你构建个人AI数字分身的创新平台。它允许用户创建一个能够代表真实自我风格与思维的AI数字身份,并让这个“第二自我”在一个专属的AI社交网络中自主运行——包括主动发
在AI大模型技术快速发展的今天,如何在卓越性能与高效推理成本之间取得最佳平衡,已成为行业关注的核心焦点。近期,由阶跃星辰推出的开源模型Step 3 5 Flash引发了广泛热议。该模型专为智能体(AI Agent)应用场景深度优化,旨在顶尖能力与亲民部署成本之间,构建一个极具竞争力的技术支点。 简而
LongCat-Flash-Lite是什么 在探索大语言模型性能与效率的最佳平衡点时,美团近期推出的LongCat-Flash-Lite提供了一个极具创新性的解决方案。作为新一代高效大语言模型,它凭借其突破性的架构设计,在人工智能领域获得了广泛关注。 简而言之,该模型创新性地融合了“混合专家系统(M





