“牛是贵了点,但挤出来的奶便宜啊!”
在2026年的CadenceLive大会上,当被问及“AI硬件是否定价过高”时,NVIDIA首席执行官黄仁勋用一句生动的比喻来回应。他没有回避旗下AI系统售价高昂的现实,而是着重强调,这些系统所能产出的,正是全球成本最低的“token”。
所谓token,是AI运算的基础单位,可类比为语言模型中的“字符”。无论是生成一段文字,还是完成一次对话,AI的每一次交互都离不开海量token的运算。因此,token的生成效率,直接决定了AI系统的实际能力以及用户最终的使用成本。
黄仁勋指出,提升token生成速度,绝非单纯依靠硬件的“暴力堆料”。若缺乏成熟软件生态的配合,再强大的硬件也无法发挥全部潜力。真正高效的路径在于软硬件的深度协同。而NVIDIA深耕多年的CUDA软件生态,正是将其硬件性能榨取到极致、从而把单个token成本压到最低的核心秘密。
“买得越多,省得越多”
黄仁勋坦承,基于Blackwell平台乃至下一代Rubin平台的NVIDIA顶级AI系统,单套售价可达数百万美元之巨。然而,这些系统的价值在于其前所未有的规模化token生成能力,能够为企业创造数十亿美元级的营收。摊薄下来,其单个token的生成成本做到了全球最低。
不仅如此,在能效比上,NVIDIA的系统同样领跑行业,实现了全球最低的“每瓦特token产出”。黄仁勋对此信心十足,甚至抛出了一个有趣的商业逻辑:“买得越多,省得越多。”这意味着,大规模采购其高端系统,从总拥有成本(TCO)的角度来看,反而是一种更加经济的选择。

全栈竞争:AI行业的新赛场
在黄仁勋的视野里,上述优势并非偶然,而是源于NVIDIA坚定的全栈式布局。他认为,AI行业的竞争格局已经改变。未来,任何企业若想保持领先,就必须具备打通从上层软件、底层系统到终端应用的全链条能力。
正是基于这种“全栈思维”,NVIDIA重新定义了评估AI系统的核心指标。行业的关注点不应再局限于硬件的峰值算力,而应转向更实际的商业指标:生成每一个token所需的成本和功耗。这标志着,AI竞赛已经从单纯的硬件性能比拼,进入了以效率和总拥有成本为核心的综合实力较量阶段。

挑战中的护城河
眼下,自主智能体(Agentic AI)的浪潮正席卷整个科技界,NVIDIA也面临着来自各竞品的追赶以及供应链等多重挑战。然而,从其多年来战略部署与市场成果来看,这条由软硬件协同构筑的护城河依然深阔。在可预见的未来,凭借对“效率与成本”这一核心赛道的定义与掌控,NVIDIA在AI领域的龙头地位,仍然难以撼动。
