最近,谷歌对Meta下达了一项“算力限制令”,正式限制后者使用Gemini大模型的算力配额。表面上看,这只是两大科技巨头之间的一次商业摩擦,但深入剖析后会发现,它狠狠戳中了当前AI行业最敏感的痛点:即便是拥有全球顶尖算力基础设施的企业,也无法承受市场对算力资源的疯狂需求。算力供给严重跟不上需求,已成为阻碍人工智能产业向更高层次发展的核心硬伤。

这场冲突的导火索,归根到底是Meta“要的太多了”。早在2026年3月,Meta就向谷歌提交了使用Gemini大模型的算力申请,其申请的规模直接超出了谷歌当时能够提供的最大额度。谷歌当时就明确表示:供应不上。但问题在于,2026年第二季度全球AI应用迎来大爆发,Gemini API的市场请求量在短短5个月内(3月至8月)直接翻倍,谷歌云后端积压的订单量环比也接近翻倍。整个行业的开发者和企业客户都在争抢那有限的算力资源——池子只有这么大,谁喊得最大声、要得最多,谁就被优先“挤兑”。Meta自然成了最明显的目标。
面对算力供不应求的困境,谷歌从5月17日开始对所有Gemini客户执行算力额度限制。这套规则类似于手机流量套餐:所有客户的算力使用都会被纳入一个每周滚动更新的5小时窗口,同时设有明确的每周使用上限,一旦超出就会临时暂停。其他谷歌云企业客户当然也受到了影响,但Meta对Gemini算力的依赖程度和需求规模远超普通客户,因此被“卡”得最为严重。
算力供给突然出现缺口,直接打乱了Meta的人工智能研发节奏。多个内部AI项目因为无法获得足够的Gemini算力,相关研发工作被迫推迟。为了在有限额度内保障核心项目,Meta内部已经正式下发通知,要求全体员工节约使用AI词元(token)——优化调用逻辑、精简无效请求,确保每一份算力都用在最关键的环节,在配额范围内尽可能多完成任务。
不要把这件事看作仅仅是两大巨头之间的孤立摩擦,它其实是全球AI产业发展现状的一个缩影。近年来,各大科技企业投入数十亿美元购买高端AI芯片、建设超大规模数据中心,拼命追赶算力增长。但市场对AI服务的需求增速,依然远远超过基础设施的扩建速度。连谷歌这样持续加码AI投入的巨头都难以支撑,算力供给缺口已是制约整个产业规模化落地的核心瓶颈,这一点已是行业共识。
从更深层的行业视角来看,这一事件给所有AI玩家敲响了警钟:在大模型与智能体技术快速迭代的今天,算力早已不是可以无限供应的底层资源,而是决定企业研发节奏、业务落地速度的关键战略资产。未来很长一段时间内,谁能把算力调度与供需调配做得更精准,谁就能在竞争中抢占先机。整个行业也将在算力供给的倒逼之下,去探索更高效的调度机制、更精简的推理技术,推动AI产业在有限资源条件下走出一条更高质量的发展路径。
