谷歌算力吃紧限制Meta调用Gemini模型

时间：2026-06-29 12:31

近期，谷歌在人工智能领域掀起了一场不小的波澜——其旗下Gemini平台的算力供给突然收紧，甚至连Meta等长期合作的大客户也收到了“限制令”。这一操作放在几年前几乎难以想象：一个AI平台竟然因为增长过快、算力不足，不得不主动约束自己的头部合作伙伴。然而，这恰恰映射出当下行业最真实的现状。表面看来，

近期，谷歌在人工智能领域掀起了一场不小的波澜——其旗下Gemini平台的算力供给突然收紧，甚至连Meta等长期合作的大客户也收到了“限制令”。这一操作放在几年前几乎难以想象：一个AI平台竟然因为增长过快、算力不足，不得不主动约束自己的头部合作伙伴。然而，这恰恰映射出当下行业最真实的现状。

表面看来，这不过是谷歌与Meta之间围绕“算力资源”展开的一场博弈，但背后折射出的，是整个人工智能产业正在经历的、一场前所未有的结构性转型与阵痛。

事件源于今年3月。据知情人士透露，谷歌直接告知Meta：贵方所需的Gemini模型算力额度，我们确实无法足量供应了。原因非常直接——需求增长速度远超预期，现有算力容量已不堪重负。这一消息立即打乱了Meta内部多个AI项目的推进节奏。据悉，Meta员工不得不开始精打细算，要求大家减少调用AI模型时的“令牌”（token）数量，提升使用效率，能省则省。

你可能会问：算力究竟紧张到什么程度？不妨看一组内部数据。从2025年3月到8月，短短5个月内，Gemini API的调用量从约350亿次飙升至约850亿次，翻了一倍还多。这样的增长态势，早已不是“预判失误”所能解释，而是整个供需逻辑被彻底改写的结果。谷歌的核心资源——AI算力，必须重新进行分配。作为最大客户之一，Meta自然首当其冲。

那么，谷歌是如何应对的？答案是：从“无限供应”切换至“配额管理”模式。

谷歌的应对措施：从无限到配额

自2026年5月17日起，谷歌对Gemini应用实施了一套全新的使用限制系统，简单来说，类似于手机流量套餐。用户不再享有无限请求权限，而是在一个每5小时滚动刷新的额度窗口内使用，同时设有每周总额度上限。额度消耗多少，取决于你的提示词复杂程度、调用的模型功能、对话长度等因素。一句话总结：用得越多、越复杂，额度消耗越快。

其目的不言而喻：在快速增长阶段，确保所有客户都能公平使用API，避免个别超大型客户“吃干抹净”。

事件折射出行业性算力瓶颈

这件事的本质，实际上已经超越了谷歌与Meta两家公司的博弈。它暴露出的，是当下AI产业一条核心铁律：算力，正在成为比芯片、比资本更难逾越的瓶颈。没错，即便是谷歌这样级别的巨头，持续投入巨额资本开支建设数据中心、采购AI芯片，依然追不上生成式AI近乎疯狂的扩张脚步。

谷歌云2026财年第一季度财报印证了这一点：算力限制导致他们无法承接更多客户需求，云业务积压订单环比接近翻倍。这意味着市场的真实需求，已经远远超出当前基础设施的供给能力。而Meta为了摆脱对外部算力的依赖，早已开始未雨绸缪。他们的计划是重金投入——到2028年，在美国累计投资6000亿美元，自建数据中心。这不仅仅是财务决策，更是对整个行业“算力租借”模式的一次深度反思。

所以，别再把这则消息仅仅当作一次“供应短缺”的新闻。它揭示的是一个全新的时代特征：AI算力不再是取之不尽的廉价资源，而是需要精细管理、战略博弈的核心资产。未来的竞争，谁能抢到算力、用好算力，谁才能真正掌握主动权。

来源：https://www.techweb.com.cn/it/2026-06-29/2976971.shtml

Gemini