算力告急:谷歌收紧Gemini API配额,Meta首当其冲
生成式人工智能的热潮仍在加速升温,然而一个现实瓶颈已经凸显:算力资源正变得愈发稀缺。近期,谷歌因Gemini AI平台的调用量激增,不得不开始限制资源供应。简单来说,就是需求远远超过了供给能力。
自2025年春季以来,Gemini API的请求量翻了一番,算力基础设施承受的压力急剧上升。为维护生态系统的公平性,谷歌于2026年5月17日正式推行基于算力额度的使用限制——机制类似手机流量套餐的滚动更新。超出配额的请求将被系统降频或直接限制,目的是确保所有合作伙伴在资源紧张的环境下,至少能获得基础的调用支持。
在这轮调整中,Meta遭受的冲击最为显著。原因非常直接:Meta对该模型的需求远超其他客户,而谷歌此前已明确表示无法足额满足其申请的算力配额。这一突发限制直接打乱了Meta内部多个AI项目的研发节奏。更棘手的是,Meta同时还在压缩人工智能研发成本——两面夹击之下,公司紧急要求员工优化调用流程,提升代码效率与令牌使用效率,试图从每个环节“省”出算力。
行业分析人士普遍认为,这次资源调控暴露了全球AI算力基础设施的一个严峻现实:大模型能力持续飞跃,但支撑其高效运转的基础算力建设速度,远远跟不上爆发式增长的应用需求。对于像Meta这样深度依赖云端算力的科技巨头而言,如何在资源受限的前提下维持研发速度,将成为下一阶段竞争真正的分水岭。
