游乐游手机版
首页/科技数码/文章详情

谷歌未发论文引发恐慌:华指市场误读芯片股

时间:2026-03-27 13:01
来源:环球网【环球网财经综合报道】一篇尚未正式发表的学术论文,在3月26日引发全球存储芯片板块剧烈震荡。据测算,全球主要内存巨头市值单日蒸发超900亿美元。这场波动的导火索,是谷歌研究院即将在国际学

来源:环球网

【环球网财经综合报道】一篇尚未正式发表的学术论文,在3月26日引发全球存储芯片板块剧烈震荡。据测算,全球主要内存巨头市值单日蒸发超900亿美元。


这场波动的导火索,是谷歌研究院即将在国际学习表征会议(ICLR 2026)上正式亮相的论文“TurboQuant”。

通常来说,当用户与AI对话时,模型需要记住历史上下文,这部分临时存储的数据随上下文窗口膨胀而指数级增长。

谷歌团队通过两项创新技术PolarQuant(极坐标量化)和QJL(量化JL变换),实现了在“零损失”前提下将KV Cache压缩至3-bit精度,内存占用缩小至少6倍。在英伟达H100 GPU上,4-bit TurboQuant的注意力计算速度比32-bit未量化版本快8倍。

Cloudflare首席执行官将这一突破称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极致效率大幅拉低AI运行成本。

面对科技圈的狂热与二级市场的抛售,华尔街投行表现出明显冷静。

摩根士丹利在最新研报中明确表示,市场存在误读。该技术仅作用于推理阶段的键值缓存,不影响模型权重所占用的高带宽内存(HBM),也与AI训练任务无关。分析师强调,所谓“6倍压缩”并非存储总需求的减少,而是通过效率提升增加单GPU的吞吐量。

Lynx Equity Strategies分析师KC Rajkumar指出,媒体报道存在夸大成分。当前推理模型早已广泛采用4-bit量化数据,谷歌所谓的“8倍性能提升”是建立在与老旧32位模型对比的基础之上。

摩根士丹利援引经济学中的“杰文斯悖论”解释长期影响:技术效率提升虽降低单位成本,但往往因使用门槛下降而带动整体需求扩张。

富国银行分析师Andrew Rocha指出,压缩算法的存在从未从根本上改变硬件采购的整体规模。通过大幅降低单次查询的服务成本,这类技术能让原本只能在昂贵云端集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛。

从供应链视角看,2026年服务器DRAM需求预计增长39%,HBM需求年增58%。TurboQuant的优化效果或将被行业增长浪潮淹没。

截至发稿,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表。关于该技术的讨论将在4月的ICLR 2026会议上继续发酵。(陈十一)

来源:https://www.163.com/dy/article/KP18HP850514R9OJ.html
上一篇联想基金会再投400万:AI赋能乡村教育的创新实践 下一篇券商掘金AI新赛道:资本热捧“词元”成投资主线
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态
科技数码 · 2026-07-01

国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态

6月30日,机器人ETF易方达(159530)盘中涨幅超过4 3%,报收1 555元,机器人板块整体表现活跃。消息面上,国内首个基于开源鸿蒙的机器人操作系统社区(M-Robots)正式启动运营并发布了年度发展路线,日本GMO INTERNET集团子公司与宇树科技达成合作协议。国产机器人软件生态建设取

ROI利剑悬顶,AI员工面临效益大考
科技数码 · 2026-07-01

ROI利剑悬顶,AI员工面临效益大考

先说说现在AI行业一个普遍现象:几乎所有公司都在按“使用量”来收费。不管是按token消耗算,还是按额度制走,本质上都是“用多少,付多少”。 这套模式放在模型API上当然没问题,但放到那些越来越深入企业工作流的Agent身上,就有点水土不服了。你想想,一个Agent为了完成一个任务,需要反复读取上下

武汉光谷三年投入超10亿元打造智能体之城
科技数码 · 2026-07-01

武汉光谷三年投入超10亿元打造智能体之城

6月29日,武汉光谷智能体经济大会正式召开,会上重磅发布了“光谷智能体引力计划”。根据规划,未来3年内,光谷将在政策扶持、算力基建、产业基金等领域投入超过10亿元,致力于全域打造智能体之城,抢占人工智能产业新高地。 具体如何推进?主要依托湖北科创供应链平台,设立光谷智能体场景发布厅,引导百亿级人工智

苹果印度梦受挫 iPhone 18 Pro机密文件泄露
科技数码 · 2026-07-01

苹果印度梦受挫 iPhone 18 Pro机密文件泄露

从暗网流出的文件来看,窃取苹果印度供应商塔塔电子数据的勒索软件组织,此次曝光的“重磅信息”中,明确包含了即将发布的iPhone 18 Pro机型的敏感组件清单、供应商名单以及实物照片。消息人士和文件内容均证实了这一点。 这绝非小事。苹果在全球供应商之间精密运转的iPhone组装业务,直接面临威胁。众

企业级AI聚焦全场景闭环办事加速成为业绩抓手
科技数码 · 2026-07-01

企业级AI聚焦全场景闭环办事加速成为业绩抓手

AI产业正从技术验证阶段迈向深度产业落地的关键转型期,这一趋势正成为驱动企业数智化增长的核心引擎。6月30日,联想乐享迎来重要升级——4 0版本正式发布。作为业界首个企业级超级智能体,此次升级带来了三项扎实成果:自主研制的Harness运行层、自我进化与反思机制,以及多场景Skill能力体系,三大支