2026年算力市场展望:GPU转攻内存,云服务格局重塑与算力泡沫辨析
财联社1月21日讯(记者 付静 王碧微)“我们手上的H100、H200全部都租出去了。前几天准备买64台H200,到处找现货,只零零散散找到了几十台。B200在国内基本上没有现货,上次拿着现金在深圳到处收货,最后只收到十几台。”2026年1月,算力租赁从业者王伟(化名)向财联社记者讲述了他在深圳的抢货经历。
岁末年初,国内的算力供应链下游市场就屡屡传出货源告急的消息,王伟甚至将这种现状称为“地狱模式”。
多位从业者向财联社记者证实,目前市场处于极度供需失衡状态,英伟达B200等高端GPU芯片在国内市场几乎“隐形”,5090、4090等中低端GPU受原材料涨价等因素影响价格激增;下游带动下,DDR5内存条价格大幅跳涨,部分大容量型号涨幅超过300%。
财联社记者注意到,算力市场剧烈波动之时,正值摩尔线程-U(688795.SH)、沐曦股份-U(688802.SH)等国产AI芯片企业密集挂牌上市之际,2026年伊始,算力市场就一个字:热!
显卡商转行炒内存,“套牌车”混入服务器
本月初,有自媒体文章称“元旦上班第一天,算力供应链骂声一片,2026年的算力市场开局就是‘地狱’模式。”
受访的几位算力从业者坦言,这种描述实际上并不夸张。
“很痛苦,现在是算力需求旺盛,但是(算卡)资源确实是不足的。我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了,都只有一点点零零散散的东西。”王伟告诉财联社记者。
“对我们来说,现在的问题不是买不到卡,而是太贵。”一家AI厂商基础设施负责人告诉财联社记者。
国产算力商基流科技的一位高管告诉财联社记者,目前,高端训练卡由于其不可替代性和供需缺口,价格坚挺,货源稀缺;而消费级显卡,则在显存等核心元器件成本上升传导后价格飙涨。
北京澜启智算业务负责人郑万利告诉财联社记者,2025年9月以来,DDR5内存条价格上涨超300%,DDR4内存条涨幅也超150%。
“64GB DDR5 5600速率的内存现在涨到了1万多,4800速率的也要差不多1万,但在2025年7、8月份时才2000多块钱,涨了4倍多。”郑万利向记者列举了一组数据,“96GB的价格现在应该是2万出头,128GB的往3万去了。”
郑万利算了一笔账:原来一台H100机头价格约30万元,现在仅装配32根64GB内存条的成本就超过30万元。
如果配置B200机头,至少需要24根内存条,加上CPU、硬盘、机架、电源等,整机价格已攀升至六七十万元。
郑万利还透露,H200整机价格最低时曾降至190多万元,目前最新报价已回升至230多万元。
上述AI厂商基础设施负责人则透露,“目前8卡5090加CPU加内存的整机已经报价40多万,上个月只要32万。”
根据慢慢买App,一款10月在京东售价为16899元的七彩虹RTX5090D显卡价格已经飙涨至今日的20399元。
甚至连二手租赁价格也随之波动,一位算力租赁商告诉记者,现在算力租赁价格相较此前低点已经涨了5%-10%。
除了供应链本身的产能受限,投机资金的涌入加剧了市场的疯狂,渠道供应商马明(化名)观察到,一些原先做显卡的渠道商现在转行做起了存储生意。
“显卡资金占用量大,而存储风险更低,涨幅更快,能快进快出。”马明告诉财联社记者,这些渠道商基本上从去年10月、11月开始收货,手法是“左脚踩右脚”——低价收货,高价出掉,再用更高的价格收回,不断推高市场水位。
马明举例分析,市场上存在三类存储产品:真实消耗的、未消耗的、库存补出来的。
有人以4000元收购2000根内存,其中1000根被装机消耗,另外1000根则以4300元卖给下一手投机者。
在高额利润的诱惑下,黑灰产链条开始滋生,马明向记者揭露了存储市场背后的“假内存”现象。
第一类是“套牌车”,卖方手中有正式版货源,也有拆机货,他们将拆机货原本的标签换掉,包装成正式版货出售,同一个序列号可能同时出现在两根内存上,卖给不同的客户。
第二类情况更为恶劣,马明透露,市场上出现了连PCB板、颗粒都是假的内存条,这些产品并非原厂生产,无法达到原厂质检标准,装入服务器后会出现严重的性能问题。
“其实除了内存,硬盘、处理器都涨得很疯狂。”马明补充道,硬盘价格翻了1-3倍,服务器处理器涨幅很大,且很多型号处于缺货状态。
一位渠道商告诉财联社记者,一款英特尔i5处理器,现在售价约1800元,9月份大概1400元,一路涨起来;英特尔至强6530处理器目前售价约9200元,而一个月前则为8000出头。
KeyBanc数据显示,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10%-15%。
H200“看得到摸不着”,国内算力需求将分流
在价格暴涨的同时,核心算力芯片的供应依然是产业链的痛点。
尽管近期美国已放宽英伟达H200对华出口,但多位受访者表示,国内供应实质性短缺的局面并未改变。
“目前的情况比较特殊。”一位算力服务企业高管告诉财联社记者,虽然政策有放宽迹象,但实际进口审批流程依然严谨,导致H200的实质性供给非常有限,国内处于“看得到但还不太摸得着”的状态。
优刻得(688158.SH)服务器中心及AI算力负责人丁振雷持有类似观点,他向财联社记者表示,美国放宽H200出口,长期战略上不会产生影响,但在短期内,面对大的算力场景,企业可能会“缓一缓”,等待具体落地情况。
这种“看得到摸不着”的供应现状,正在倒逼算力需求在市场中分流。
前述基流科技高管分析,未来市场会形成“多层次、多路径”的并行格局。
对极致性能和有国际生态依赖的场景,企业仍会争取英伟达芯片;但对更广泛的行业应用、对数据安全与自主可控有高要求的政务和企业市场,国产算力已成为主流选择。
“国产算力芯片的机会,不在于在通用赛道上全面正面超越,而在于聚焦优势战场。”该高管认为,在推理场景、工业质检、智能政务、金融风控等行业专用场景,国产芯片在能效比、成本和特定模型适配上已展现出性价比优势。
云服务厂商的采购动作印证了这一趋势,丁振雷向财联社记者透露,优刻得目前已采购了3-5家国产芯片。
“只要能国产替代的,我们首先能做的工作就是提早适配。当它的性能优化到一定程度的时候就快速引入,这时候供给来源要多样化。”丁振雷表示。
与此同时,软件定义的趋势正在反向重塑硬件标准。
郑万利向财联社记者分析,DeepSeek等国产大模型的爆发,对MoE(混合专家)架构和混合精度训练提出了具体要求,这倒逼国产硬件厂商必须跨过“适配”这道门槛。
郑万利判断,国产算力接下来会迎来更多市场需求,未来两年将是国产算力开拓商业市场的关键期,“国产卡肯定是个方向”。
对于市场上关于“算力过剩”或“泡沫”的讨论,一线从业者给出了不同的观察。
“那些说算力过剩的,都是制造焦虑。国内算力是远远不够的。”王伟直言,目前模型距离成为真正的生产工具还有距离,需要持续投资。
丁振雷则从技术逻辑层面反驳了泡沫论,他认为,2025年是Agent(智能体)元年,Agent是提高生产力的逻辑而非单纯的降本逻辑。一个真正好用的Agent落地,对Token(词元)的消耗是巨大的。
“如果Agent不落地,算力可能是过剩的;但只要解决了真正的生产力问题,算力还是欠缺的。”丁振雷表示。
上市潮背后,“烟囱”难题仍存
供应链焦虑的另一面,是国产芯片企业在资本市场的高歌猛进。
2025年底,摩尔线程、沐曦股份相继在科创板上市,首日涨幅分别达到468.78%和692.95%。随后,壁仞科技(06082.HK)登陆港交所,天数智芯(09903.HK)启动港股公开认购并获得超300倍的超额认购。
资本热潮下,相关公司的财务数据尚待改善。根据招股书数据,摩尔线程与沐曦股份过去三年合计亏损超过80亿元;正在冲刺科创板的长鑫科技(DRAM厂商),截至2025年6月30日,累计研发投入188.67亿元,占累计营业收入的33.11%,但其2025年前三季度的归母净利润-52.8亿元,同比仅略微减亏。
同时,TrendForce集邦咨询分析师龚明德告诉财联社记者,预计2026年全球AI服务器产值将提升逾42%,达到4300亿美元,在这个庞大的市场中,国产厂商面临的不仅是资金问题,更是如何解决“不好用”的技术难题。
海光信息(688041.SH)副总裁吴宗友在接受财联社记者采访时指出,过去几年信创国产化发展很快,但也给客户造成了不少困扰,不同芯片厂商各自为战,形成了“烟囱式”的建设模式,导致算力利用率低下。“有这么多的芯片,都要去适配和优化,投入的成本非常多。”
为此,海光信息正在推进“AI计算开放架构”。吴宗友介绍,该架构没有加入门槛,旨在把所有的AI产业链上下游厂商聚合在一起,形成统一的开发规范,让客户不再被单一芯片绑定。
“国内各行各业尤其是互联网客户非常接受AI计算开放架构。”吴宗友透露,互联网客户购买力强,不希望被单一厂商控制,因此对开放路线接受度很高。
上述基流科技高管也表示,该公司研发的Venus智算平台能够兼容多种硬件架构,支持异构GPU,降低对进口GPU的依赖,同时能够实现高效混合训练与推理。
在硬件集群建设层面,挑战同样严峻。中科曙光(603019.SH)高级副总裁李斌告诉财联社记者,建设万卡集群并非简单的堆砌,随着规模扩大,互连网络、可靠性和能效都面临以指数级上升的工程难题。
李斌特别提到了当前行业热议的“光铜之争”,他认为,铜连接虽然成本低、功耗低,但传输距离受限。随着单链路速率提升至200G或400G,铜线传输距离缩短至厘米级,芯片直接出光成为必然趋势。
“为什么要用到CPU?因为现在光模块功耗高、可靠性差,十万卡规模如果全用光模块根本做不起来。”李斌分析,未来硅光和CPU技术成熟后,可以大幅提高可靠性并降低功耗。他预判,当速率超过400G时,没有"硅光技术"的系统可能无法实现。
为了解决异构算力的管理难题,云厂商正在尝试通过软件调度来抹平硬件差异。
丁振雷介绍,优刻得正在做异构管理和虚拟化能力,将不同算力切割得更细,把合适的负载调度到合适的位置。“原本大家采用不同类型的卡担忧很大,如果有统一标准,门槛会大大降低。”
从存储市场的投机乱象,到芯片供应的博弈,再到架构层面的突围,2026年的算力市场在焦虑与希望中开局。
对于国产厂商而言,上市融资只是获得了入场券,能否在“地狱模式”中通过技术和生态的考验,是未来两年必须解决的现实难题。
相关攻略
OpenClaw是什么?2026年最新一键部署方法与实战指南 如果您正在寻找一款功能强大、完全开源的AI智能体框架,那么OpenClaw(曾用名Clawdbot或Moltbot)无疑是当前的优选。它凭借卓越的任务自动化能力与丰富的工具集成生态,已成为个人开发者与企业构建智能助理的首选平台。然而,对于
参考指南与学习资料 若您希望在本地快速搭建并部署一个个人智能助手,OpenClaw 框架是一个理想的入门选择。为了帮助开发者更高效地上手,社区中已有丰富的学习资源与讨论可供参考,主要包括:OpenClaw 新手入门教程、核心命令行工具使用指南(openclaw -h 查看帮助)、配置文件的参数详解,
一、 OpenClaw 安装部署指南 想在Windows 11系统上顺利运行OpenClaw吗?目前最稳定高效的方案,是借助WSL 2(Windows Subsystem for Linux)搭建Ubuntu-24 04环境。我们已为你准备了一份超详细的“手把手”教程。请直接参考这篇实战指南《Win
如何在OpenClaw中配置Tavily搜索插件实现实时搜索 想让你的OpenClaw智能体立即拥有检索互联网实时信息的能力?接入Tavily搜索插件是最直接高效的解决方案。本文将为你详细介绍完整的配置流程,只需简单几步即可完成集成。 1、插件安装步骤 首先需要安装官方提供的Tavily插件模块。打
本次部署指南的核心目标非常明确:在 Linux 环境中,无论是云服务器还是本地物理机,我们都需要完整地完成 OpenClaw 智能体框架的安装与部署,并通过基础的健康检查与功能验证,确保整个系统能够成功启动并稳定运行。 一、环境要求 在开始动手安装之前,我们首先需要确认系统满足所有的基础运行环境要求
热门专题
热门推荐
《生存33天》角色深度解析:绵绵与天使的战术定位与阵容搭配指南 首先,我们深入分析天使这位角色。她的定位非常清晰:兼具复活能力与真实伤害的团队核心支援者。在当前版本中,天使的治疗强度与稳定性均属于一线水准,而其灵魂所在是她的被动技能——只要她在场,全队成员的攻击倍率便会获得持续增益。这一机制意味着,
《伊瑟》平民传说肉队攻略:全方位养成与实战指南 在《伊瑟》的竞技场环境中,若论哪套体系最为稳健且拥有最高下限,答案毫无疑问指向“肉队”。这套体系的核心在于围绕具备强大生存能力与持续输出潜力的坦克型核心构建阵容。凭借其卓越的容错率与版本适应性,肉队不仅是当前环境的主流解法,更是平民玩家冲击高段位的可靠
消息称国产折叠屏旗舰定档7月发布:核心物料与镜头模组全面国产化,疑似小米MIX Fold 5 近期,数码科技领域再度传来重磅动态。据知名爆料博主@智慧皮卡丘在微博平台透露,国内某头部厂商的下一代折叠屏旗舰手机,已在核心物料、影像镜头模组乃至系统软件层面实现了大规模国产化与深度自研。在当前的产业链发展
世界印记效果完整指南:洛克王国战力提升核心策略 在《洛克王国》的探索与对战征程中,世界印记的作用远超表面装饰。它是一套精密的潜能激发系统,能够从根本上重塑宠物的战斗能力,实现战力的阶梯式增长。本文将为您全面剖析世界印记的多重效果,助您掌握这项至关重要的制胜利器。 一、属性强化:构筑稳固战斗基石 世界
洛克王国初始精灵怎么选?御三家深度对比指南 在洛克王国的冒险之初,每位小洛克都将面临一个至关重要的抉择:从火花、水蓝蓝和喵喵这三只初始精灵中,选择自己的第一位伙伴。这个选择不仅决定了你早期的战斗体验,更将影响你的阵容搭配与战术风格。本文将从属性、技能与实战定位三个方面,为你全面解析洛克王国御三家精灵





