1月10日,知名科技媒体汤姆硬件发布了一篇报道,援引其在CES 2026媒体问答会上的见闻。面对市场上关于采用廉价内存以削减成本的声音,英伟达首席执行官黄仁勋做出了反驳。他强调:“芯片是一次性买卖,但软件开发却需要终身的维护与投入。”
黄仁勋进一步指出,AI产业已经进入了“Token经济学”的时代,其核心衡量标准是“每瓦特电力、每美元成本能够生成多少Token”。
英伟达始终坚持统一的内存架构和软件栈。虽然这一策略导致初期硬件成本相对较高,但却能有效避免软件生态的碎片化问题。这意味着,一旦英伟达对某个软件栈完成优化,全球所有基于该架构的AI算力设施都能同步获得性能提升,从而在更长周期内实现更优的总体拥有成本。
在谈及行业趋势时,黄仁勋透露了一个关键数据:开源模型目前已经贡献了全球约四分之一的Token生成量。这一“意料之外”的爆发式增长,极大地拓展了AI技术的落地场景,从超大规模的云服务商延伸至企业内部的本地集群。
黄仁勋在问答中还详细展示了Vera Rubin平台的模块化创新。与以往Grace Blackwell系统一旦故障便需整个机架下线的情况不同,Rubin平台采用了托盘式架构。该架构支持在系统运行时直接更换NVLink等关键组件,真正实现了“边运行边修复”。
据引述的博文介绍,这种设计不仅大幅降低了运维成本,更彻底重构了供应链效率:单个节点的组装时间从过去惊人的2小时缩短至仅仅5分钟。此外,Rubin平台摒弃了复杂的线缆设计,并将冷却系统从80%的液冷升级为100%全液冷,进一步提升了整个系统的可靠性。
供电稳定性被黄仁勋称为当前算力扩张面临的“最大瓶颈”。由于现代AI负载(尤其是推理任务)会引发剧烈的瞬时功耗波动,电流波动幅度往往高达25%,这迫使数据中心不得不储备大量冗余电力以应对峰值需求。
Rubin平台通过系统级的电子设计创新,在机架内部“平滑”了这些功率波动。即使单颗GPU的热设计功耗高达1800W,系统也能向外部电网呈现出一条稳定的负载曲线。这种设计让运营商无需进行过度的电力冗余配置,从而能够近乎百分之百地利用电力容量。
