谷歌新内存技术冲击存储芯片市场 闪迪股价大跌超11%
3月27日消息,据媒体报道,美东时间3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,美光科技跌近7%。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
业内人士分析,这一波动源自谷歌研究院即将在国际学习表征会议(ICLR 2026)上正式亮相的学术论文,该研究推出了一种新型AI内存压缩技术“TurboQuant”。
谷歌宣称,该技术可将大语言模型推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上实现最高8倍的性能加速。
AI模型运行时存在一种“工作内存”,即KV缓存(Key-Value Cache)。每当模型处理信息、生成回答时,KV缓存便会迅速膨胀,且上下文窗口越长,缓存占用的内存越大。
TurboQuant本质上是一种极致的量化压缩算法,传统量化方法需要在压缩精度和额外存储开销之间妥协,而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项创新,实现了在“零损失”前提下将KV缓存压缩至3-bit精度。
Cloudflare首席执行官将这一成果称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极致效率大幅拉低AI的运行成本。
不过,摩根士丹利在最新研报中指出,市场对此存在误读。该技术仅作用于推理阶段的键值缓存,并不影响模型权重所占用的高带宽内存(HBM),也与AI训练任务无关。
分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过效率提升增加单GPU的吞吐量。这意味着在相同硬件条件下,可以支持4倍至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。
目前,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表,研究团队计划在下个月的ICLR 2026会议上正式发布相关成果。

相关攻略
3月27日消息,据媒体报道,美东时间3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,美光科技跌近7%。业内人士分析,这一波动源自谷歌研究院即将在国际学习表
虽说如今 AMD 锐龙和英特尔酷睿仍然在回合制竞争,但本质上都秉持着「科技以换壳为本」的营销策略。 很怀念过去的 PC 市场。虽说如今AMD锐龙和英特尔酷睿仍然在回合制竞争,但本质上都秉持着「科技以
机器之心编辑部很怀念过去的 PC 市场。虽说如今 AMD 锐龙和英特尔酷睿仍然在回合制竞争,但本质上都秉持着「科技以换壳为本」的营销策略。我们都清楚,在 AI 引发的全球性芯片短缺的浪潮下,GPU,
3月26日消息,据洛图科技最新数据,2026年1-2月中国大陆笔记本电脑线上公开零售市场(不含抖音、快手等内容电商)遭遇量额双杀。具体来看,统计期内销量仅94 7万台,同比暴跌40 5%;销售额59
3月17日消息,据媒体报道,随着人工智能(AI)需求的持续飙升,一场前所未有的存储器供应危机自去年下半年从DRAM领域开始蔓延,随后逐渐波及NAND闪存市场。到今年初,这场供应危机已对电子消费领域产
热门专题
热门推荐
IT之家 3 月 27 日消息,今晚,华为 Mate80 Pura 70 等多款机型陆续推送鸿蒙 HarmonyOS 6 0 0 328 SP52 更新,沉浸光感功能下放。IT之家整理主要内容如下:
PPT交互图表核心是观众主动选择,2026年主流用触发器控制显隐、超链接实现页间跳转、Excel数据链接保障动态更新,三者均不依赖插件且兼容稳定。在PPT里做交互图表,关键不是让图
宠物相机app怎么用,打开软件,点击首页,里面提供了点击拍照、拼图、相册三个选项,点击拍摄,你可以在里对宠物进行抓拍,并且可以添加水印和滤镜。宠物相机app使用教程:1、打开软件,
《我的咸鱼卡组》战斗机制:阵容由1英雄卡和8士兵卡组成,场上5名士兵,3名候补补位,士兵全灭后可直接攻击英雄。卡牌将攻击与生命合为力量值,近战力量高但攻击会被反击,远程无反击但力量
追剧追得脸盲?别慌,这张“美人地图”直接帮你拎清谁是谁,还能偷学90年代穿搭,一举两得。先说最接地气的谭松韵。镜头里她顶着半素颜、眼圈青黑,法令纹都不遮,活脱脱一个熬夜做PPT的女老板。但仔细扒,她





