发布四年仍一卡难求:英伟达H100租赁费近半年飙升近40%
进入新年,AI领域的风向似乎又变了。随着Anthropic、字节跳动这些巨头接连推出爆款应用,再加上“龙虾”热潮带火了一大批开源大模型,一个意想不到的结果出现了:英伟达那款发布已四年的H100芯片,在租赁市场上竟然上演了一出“身价反转”的戏码。
要知道,H100可是黄仁勋在2024年3月GTC大会上就发布了的产品,真正出货得到同年秋季。按常理说,这算得上是“老将”了。然而,半导体研究机构SemiAnalysis最新发布的“H100一年期租赁合约价格指数”却显示,这块“老芯片”的行情非但没有沉寂,反而一路看涨。其租赁价格自2025年10月触及每小时1.7美元的低点后,在今年3月直接飙升至每块GPU每小时2.35美元,涨幅接近40%。这个数字,足以让很多市场观察者重新审视当前的算力格局。
这份指数的背后,是对100多家云服务提供商及算力买卖双方的直接调查,数据每月采集一次,颇具参考价值。报告明确指出,目前按需租用的GPU算力已经在所有类型的GPU中售罄。更关键的是,即便近期价格不断上涨,那些已经锁定了按需实例的客户,也丝毫没有将手中算力释放回资源池的打算,惜售心态明显。
那么,架构更先进的Blackwell芯片不是已经来了吗?问题恰恰出在这里。研究人员指出,由于市场对开放权重模型的需求异常强劲,叠加推理需求持续激增,新部署Blackwell芯片的交付周期已经被拉长到了6到7个月。换句话说,远水难解近渴。
回想2025年晚些时候,市场普遍预期,随着性能更强、算力成本更低的Blackwell芯片加速部署,Hopper系列(包括H100、H200)的租赁价格将大幅下降。但现实总是出人意料,最新的情况恰恰相反:H100的需求不仅保持坚挺,在许多实际应用场景下,其需求甚至得到了进一步增强。
这股强劲的需求究竟从何而来?SemiAnalysis在报告中点出了几个关键驱动因素。今年年初,一个重要推力来自原生媒体生成的爆发。例如,字节跳动的Seedance(即“梦”应用)和谷歌的Nano Banana,极大地推动了用户对视频、图像的生成与优化需求,直接带动了词元(token)吞吐量的大幅上升。
然而,更显著的需求来源,或许是多智能体(multi-agent)工作负载的兴起。这种复杂的工作模式,使得词元使用量和相应的算力消耗,呈现出抛物线式的增长趋势,对稳定、可靠的算力供给提出了更高要求。SemiAnalysis甚至透露,仅其自身“在过去一周里就消耗了数十亿词元”,每百万词元的成本大约在5美元左右。当然,报告也补充道,由此节省的时间以及带来的工作流程与能力扩展,其回报远超算力成本本身。

