6月15日,微软官方博客发布了一篇文章,引用《Joule》期刊的最新研究成果指出,在大规模部署环境下,人工智能的能耗与用水量实际上远低于此前的市场预估。这一结论,或许会让许多人感到意外。
研究的核心观点在于:面对大规模推理应用场景,外界不应只盯着单个模型的训练或推理总规模,更应关注用户每次典型调用的“每查询”指标。换句话说,别光盯着大模型一次训练耗费多少电力,更要看每次用户提问一个问题时,系统实际消耗的资源量。
具体数据如下:一次典型的常规AI调用,耗电量在0.16到0.60瓦时之间。这是什么概念?相当于一台40瓦的电脑运行15到60秒,或者一台1000瓦的微波炉工作0.6到2秒。与之前文献和媒体报道的数值相比,这项新研究的数据低至原先的四分之一甚至二十分之一。

在用水量方面,保守估计下,一次典型查询的冷却用水量为0至0.067毫升,中位数大约仅为一百分之一茶匙,比一滴水还要少。微软特别指出,随着零用水数据中心设计的逐步推广,这一数字还有进一步下降的空间。

微软同时强调了一个关键规律:系统规模越大,单位查询的效率通常越高。大型系统可以同时处理更多请求,并在模型算法、任务调度、硬件架构等多个层面叠加优化。这就好比大型航空公司,通过统一调度能显著节省燃油——云平台同样能将效率改进扩散到每一次推理任务中。
从数据来看,在10亿次日查询的场景下,基础耗电约为0.7吉瓦时;如果引入各项效率优化措施,耗电量可降至约0.3吉瓦时。即便其中有10%的请求属于代码生成、多步推理等长任务,整体能耗仍然可以比基线水平下降一半以上。这一结果,确实值得行业重新审视AI的“环境账单”。
