发布四年仍一卡难求:英伟达H100租赁费近半年飙升近40%
4月3日消息,据媒体报道,新年以来,随着Anthropic、字节跳动等AI巨头接连推出爆款应用,叠加“龙虾”热潮带动开源大模型调用量激增,英伟达H100芯片在租赁市场上迎来身价反转。
要知道,H100芯片是黄仁勋在2024年3月GTC大会上发布、同年秋季开始出货的产品。
据半导体研究机构SemiAnalysis最新发布的“H100一年期租赁合约价格指数”,该“老芯片”的租赁价格自2025年10月触及每小时1.7美元的低点后,于今年3月飙升至每块GPU每小时2.35美元,涨幅接近40%。
该指数基于对100多家云服务提供商及算力买卖双方的直接调查,每月采集一次数据。
报告指出,按需租用的GPU算力已在所有类型的GPU中售罄——即便近期价格上涨,已锁定按需实例的客户也不愿将算力释放回资源池。
至于架构更先进的Blackwell芯片?研究人员表示,由于对开放权重模型的需求强劲,叠加推理需求持续激增,新部署Blackwell的交付周期已延长至6到7个月。
2025年晚些时候,市场一度预期,随着性能更强、算力成本更低的Blackwell芯片加速部署,Hopper系列(H100、H200)的租赁价格将大幅下降。然而最新情况恰恰相反:H100的需求不仅保持坚挺,在许多场景下甚至进一步增强。
SemiAnalysis在报告中指出,今年年初算力需求的重要驱动之一来自原生媒体生成。例如,字节跳动的Seedance(即梦)和谷歌Nano Banana推动用户大量生成与优化视频、图像,带动词元(token)吞吐量大幅上升。而更显著的需求来源是多智能体(multi-agent)工作负载的兴起,使得词元使用量和算力消耗呈现抛物线式增长。
SemiAnalysis透露,仅其自身“在过去一周里就消耗了数十亿词元”,每百万词元成本约5美元。不过公司也表示,由此节省的时间以及工作流程与能力的扩展,带来的回报远超算力成本。

相关攻略
发布四年仍一卡难求:英伟达H100租赁费近半年飙升近40% 进入新年,AI领域的风向似乎又变了。随着Anthropic、字节跳动这些巨头接连推出爆款应用,再加上“龙虾”热潮带火了一大批开源大模型,一个意想不到的结果出现了:英伟达那款发布已四年的H100芯片,在租赁市场上竟然上演了一出“身价反转”的戏
4月3日消息,据媒体报道,新年以来,随着Anthropic、字节跳动等AI巨头接连推出爆款应用,叠加“龙虾”热潮带动开源大模型调用量激增,英伟达H100芯片在租赁市场上迎来身价反转。要知道,H100
12 月 11 日消息,CNBC 昨日(12 月 10 日)发布博文,报道称英伟达(Nvidia)支持的初创公司 Starcloud 创造了历史,首次在太空轨道上成功训练并运行了人工智能模型。该公
10 月 23 日消息,科技媒体 Wccftech 昨日(10 月 22 日)发布博文,为应对地球数据中心日益增长的能耗与土地占用挑战,AI 初创公司 Starcloud 计划将数据中心发射至太空
10月23日消息,据报道,NVIDIA的H100 GPU即将在下个月展开一段“太空之旅”,AI公司Crusoe近日宣布,计划成为“首个在太空中运行工作负载的公共云运营商”。这次轨道部署的Crusoe
热门专题
热门推荐
陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。
投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。
巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。
谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。
谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。





