首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
2026年算力市场展望:GPU转攻内存,云服务格局重塑与算力泡沫辨析

2026年算力市场展望:GPU转攻内存,云服务格局重塑与算力泡沫辨析

热心网友
16
转载
2026-01-22

财联社1月21日讯(记者 付静 王碧微)“我们手上的H100、H200全部都租出去了。前几天准备买64台H200,到处找现货,只零零散散找到了几十台。B200在国内基本上没有现货,上次拿着现金在深圳到处收货,最后只收到十几台。”2026年1月,算力租赁从业者王伟(化名)向财联社记者讲述了他在深圳的抢货经历。

岁末年初,国内的算力供应链下游市场就屡屡传出货源告急的消息,王伟甚至将这种现状称为“地狱模式”。

多位从业者向财联社记者证实,目前市场处于极度供需失衡状态,英伟达B200等高端GPU芯片在国内市场几乎“隐形”,5090、4090等中低端GPU受原材料涨价等因素影响价格激增;下游带动下,DDR5内存条价格大幅跳涨,部分大容量型号涨幅超过300%。

财联社记者注意到,算力市场剧烈波动之时,正值摩尔线程-U(688795.SH)、沐曦股份-U(688802.SH)等国产AI芯片企业密集挂牌上市之际,2026年伊始,算力市场就一个字:热!

显卡商转行炒内存,“套牌车”混入服务器

本月初,有自媒体文章称“元旦上班第一天,算力供应链骂声一片,2026年的算力市场开局就是‘地狱’模式。”

受访的几位算力从业者坦言,这种描述实际上并不夸张。

“很痛苦,现在是算力需求旺盛,但是(算卡)资源确实是不足的。我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了,都只有一点点零零散散的东西。”王伟告诉财联社记者。

“对我们来说,现在的问题不是买不到卡,而是太贵。”一家AI厂商基础设施负责人告诉财联社记者。

国产算力商基流科技的一位高管告诉财联社记者,目前,高端训练卡由于其不可替代性和供需缺口,价格坚挺,货源稀缺;而消费级显卡,则在显存等核心元器件成本上升传导后价格飙涨。

北京澜启智算业务负责人郑万利告诉财联社记者,2025年9月以来,DDR5内存条价格上涨超300%,DDR4内存条涨幅也超150%。

“64GB DDR5 5600速率的内存现在涨到了1万多,4800速率的也要差不多1万,但在2025年7、8月份时才2000多块钱,涨了4倍多。”郑万利向记者列举了一组数据,“96GB的价格现在应该是2万出头,128GB的往3万去了。”

郑万利算了一笔账:原来一台H100机头价格约30万元,现在仅装配32根64GB内存条的成本就超过30万元。

如果配置B200机头,至少需要24根内存条,加上CPU、硬盘、机架、电源等,整机价格已攀升至六七十万元。

郑万利还透露,H200整机价格最低时曾降至190多万元,目前最新报价已回升至230多万元。

上述AI厂商基础设施负责人则透露,“目前8卡5090加CPU加内存的整机已经报价40多万,上个月只要32万。”

根据慢慢买App,一款10月在京东售价为16899元的七彩虹RTX5090D显卡价格已经飙涨至今日的20399元。

甚至连二手租赁价格也随之波动,一位算力租赁商告诉记者,现在算力租赁价格相较此前低点已经涨了5%-10%。

除了供应链本身的产能受限,投机资金的涌入加剧了市场的疯狂,渠道供应商马明(化名)观察到,一些原先做显卡的渠道商现在转行做起了存储生意。

“显卡资金占用量大,而存储风险更低,涨幅更快,能快进快出。”马明告诉财联社记者,这些渠道商基本上从去年10月、11月开始收货,手法是“左脚踩右脚”——低价收货,高价出掉,再用更高的价格收回,不断推高市场水位。

马明举例分析,市场上存在三类存储产品:真实消耗的、未消耗的、库存补出来的。

有人以4000元收购2000根内存,其中1000根被装机消耗,另外1000根则以4300元卖给下一手投机者。

在高额利润的诱惑下,黑灰产链条开始滋生,马明向记者揭露了存储市场背后的“假内存”现象。

第一类是“套牌车”,卖方手中有正式版货源,也有拆机货,他们将拆机货原本的标签换掉,包装成正式版货出售,同一个序列号可能同时出现在两根内存上,卖给不同的客户。

第二类情况更为恶劣,马明透露,市场上出现了连PCB板、颗粒都是假的内存条,这些产品并非原厂生产,无法达到原厂质检标准,装入服务器后会出现严重的性能问题。

“其实除了内存,硬盘、处理器都涨得很疯狂。”马明补充道,硬盘价格翻了1-3倍,服务器处理器涨幅很大,且很多型号处于缺货状态。

一位渠道商告诉财联社记者,一款英特尔i5处理器,现在售价约1800元,9月份大概1400元,一路涨起来;英特尔至强6530处理器目前售价约9200元,而一个月前则为8000出头。

KeyBanc数据显示,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10%-15%。

H200“看得到摸不着”,国内算力需求将分流

在价格暴涨的同时,核心算力芯片的供应依然是产业链的痛点。

尽管近期美国已放宽英伟达H200对华出口,但多位受访者表示,国内供应实质性短缺的局面并未改变。

“目前的情况比较特殊。”一位算力服务企业高管告诉财联社记者,虽然政策有放宽迹象,但实际进口审批流程依然严谨,导致H200的实质性供给非常有限,国内处于“看得到但还不太摸得着”的状态。

优刻得(688158.SH)服务器中心及AI算力负责人丁振雷持有类似观点,他向财联社记者表示,美国放宽H200出口,长期战略上不会产生影响,但在短期内,面对大的算力场景,企业可能会“缓一缓”,等待具体落地情况。

这种“看得到摸不着”的供应现状,正在倒逼算力需求在市场中分流。

前述基流科技高管分析,未来市场会形成“多层次、多路径”的并行格局。

对极致性能和有国际生态依赖的场景,企业仍会争取英伟达芯片;但对更广泛的行业应用、对数据安全与自主可控有高要求的政务和企业市场,国产算力已成为主流选择。

“国产算力芯片的机会,不在于在通用赛道上全面正面超越,而在于聚焦优势战场。”该高管认为,在推理场景、工业质检、智能政务、金融风控等行业专用场景,国产芯片在能效比、成本和特定模型适配上已展现出性价比优势。

云服务厂商的采购动作印证了这一趋势,丁振雷向财联社记者透露,优刻得目前已采购了3-5家国产芯片。

“只要能国产替代的,我们首先能做的工作就是提早适配。当它的性能优化到一定程度的时候就快速引入,这时候供给来源要多样化。”丁振雷表示。

与此同时,软件定义的趋势正在反向重塑硬件标准。

郑万利向财联社记者分析,DeepSeek等国产大模型的爆发,对MoE(混合专家)架构和混合精度训练提出了具体要求,这倒逼国产硬件厂商必须跨过“适配”这道门槛。

郑万利判断,国产算力接下来会迎来更多市场需求,未来两年将是国产算力开拓商业市场的关键期,“国产卡肯定是个方向”。

对于市场上关于“算力过剩”或“泡沫”的讨论,一线从业者给出了不同的观察。

“那些说算力过剩的,都是制造焦虑。国内算力是远远不够的。”王伟直言,目前模型距离成为真正的生产工具还有距离,需要持续投资。

丁振雷则从技术逻辑层面反驳了泡沫论,他认为,2025年是Agent(智能体)元年,Agent是提高生产力的逻辑而非单纯的降本逻辑。一个真正好用的Agent落地,对Token(词元)的消耗是巨大的。

“如果Agent不落地,算力可能是过剩的;但只要解决了真正的生产力问题,算力还是欠缺的。”丁振雷表示。

上市潮背后,“烟囱”难题仍存

供应链焦虑的另一面,是国产芯片企业在资本市场的高歌猛进。

2025年底,摩尔线程、沐曦股份相继在科创板上市,首日涨幅分别达到468.78%和692.95%。随后,壁仞科技(06082.HK)登陆港交所,天数智芯(09903.HK)启动港股公开认购并获得超300倍的超额认购。

资本热潮下,相关公司的财务数据尚待改善。根据招股书数据,摩尔线程与沐曦股份过去三年合计亏损超过80亿元;正在冲刺科创板的长鑫科技(DRAM厂商),截至2025年6月30日,累计研发投入188.67亿元,占累计营业收入的33.11%,但其2025年前三季度的归母净利润-52.8亿元,同比仅略微减亏。

同时,TrendForce集邦咨询分析师龚明德告诉财联社记者,预计2026年全球AI服务器产值将提升逾42%,达到4300亿美元,在这个庞大的市场中,国产厂商面临的不仅是资金问题,更是如何解决“不好用”的技术难题。

海光信息(688041.SH)副总裁吴宗友在接受财联社记者采访时指出,过去几年信创国产化发展很快,但也给客户造成了不少困扰,不同芯片厂商各自为战,形成了“烟囱式”的建设模式,导致算力利用率低下。“有这么多的芯片,都要去适配和优化,投入的成本非常多。”

为此,海光信息正在推进“AI计算开放架构”。吴宗友介绍,该架构没有加入门槛,旨在把所有的AI产业链上下游厂商聚合在一起,形成统一的开发规范,让客户不再被单一芯片绑定。

“国内各行各业尤其是互联网客户非常接受AI计算开放架构。”吴宗友透露,互联网客户购买力强,不希望被单一厂商控制,因此对开放路线接受度很高。

上述基流科技高管也表示,该公司研发的Venus智算平台能够兼容多种硬件架构,支持异构GPU,降低对进口GPU的依赖,同时能够实现高效混合训练与推理。

在硬件集群建设层面,挑战同样严峻。中科曙光(603019.SH)高级副总裁李斌告诉财联社记者,建设万卡集群并非简单的堆砌,随着规模扩大,互连网络、可靠性和能效都面临以指数级上升的工程难题。

李斌特别提到了当前行业热议的“光铜之争”,他认为,铜连接虽然成本低、功耗低,但传输距离受限。随着单链路速率提升至200G或400G,铜线传输距离缩短至厘米级,芯片直接出光成为必然趋势。

“为什么要用到CPU?因为现在光模块功耗高、可靠性差,十万卡规模如果全用光模块根本做不起来。”李斌分析,未来硅光和CPU技术成熟后,可以大幅提高可靠性并降低功耗。他预判,当速率超过400G时,没有"硅光技术"的系统可能无法实现。

为了解决异构算力的管理难题,云厂商正在尝试通过软件调度来抹平硬件差异。

丁振雷介绍,优刻得正在做异构管理和虚拟化能力,将不同算力切割得更细,把合适的负载调度到合适的位置。“原本大家采用不同类型的卡担忧很大,如果有统一标准,门槛会大大降低。”

从存储市场的投机乱象,到芯片供应的博弈,再到架构层面的突围,2026年的算力市场在焦虑与希望中开局。

对于国产厂商而言,上市融资只是获得了入场券,能否在“地狱模式”中通过技术和生态的考验,是未来两年必须解决的现实难题。

来源:https://www.163.com/dy/article/KJT4PCFG05198CJN.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

硬核OpenClaw玩法!我给OpenClaw加了个“大脑中枢”,打造最懂“一人公司”的OpenClaw仪表盘!
AI
硬核OpenClaw玩法!我给OpenClaw加了个“大脑中枢”,打造最懂“一人公司”的OpenClaw仪表盘!

引言 最近一段时间,OpenClaw的多智能体协同和全渠道接入能力,吸引了不少圈内朋友的目光。很多人跃跃欲试,想搭建自己的“赛博员工团队”,但第一个拦路虎就横在面前:这玩意儿到底该怎么部署? 这种困惑,太普遍了。网上的教程看似铺天盖地,标题一个比一个唬人,可真正动手跟着操作,十有八九会碰壁。要么是步

热心网友
04.22
openclaw接入小米大模型
AI
openclaw接入小米大模型

配置 好消息是,小米大模型现已通过OpenRouter平台开放接入。更贴心的是,新用户能享受为期一周的免费体验,这个福利窗口将在北京时间4月2日24:00关闭。如果你想尝试,现在正是时候。 如果你恰好刚刚部署了最新版本的软件,那么在初始配置流程中,会看到QQ机器人、飞书以及OpenRouter的配置

热心网友
04.22
openclaw 安装memori插件
AI
openclaw 安装memori插件

深度解析:AI生成文本的人性化润色之道 引言:当AI遇见“人味儿” 你手头有一篇AI生成的文章——逻辑清晰、信息准确,但读起来总觉得少了点什么。没错,缺的就是那股“人味儿”。在信息爆炸的今天,纯粹的工具性文本已经很难抓住读者的注意力。如何在不改变事实内核的前提下,让AI文字拥有资深专家的温度与质

热心网友
04.21
Microsoft的XMLHTTP对象介绍
前端开发
Microsoft的XMLHTTP对象介绍

MSXML XMLHTTP对象详解:实现客户端与服务器高效数据通信的核心组件 在现代Web开发与数据交互技术中,MSXML库内置的Microsoft XMLHTTP对象扮演着至关重要的角色。作为经典的数据传输桥梁,它能够将客户端数据封装为标准HTTP请求对象,并精准发送至远程服务器端。即使在当今多样

热心网友
04.19
业内首发!联想企业龙虾湖方案重磅来袭,每百万高质量Tokens不到1元
业界动态
业内首发!联想企业龙虾湖方案重磅来袭,每百万高质量Tokens不到1元

联想发布企业“龙虾湖”解决方案:重新定义企业级智能体部署 今天,联想集团正式发布了企业“龙虾湖”解决方案。这套方案整合了为“龙虾”深度优化的联想万全异构智算平台、联想问天 WA5480 G3服务器、联想存储以及联想数据网络交换机等一系列产品,旨在为客户打造一个高阶的龙虾湖算力集群。这个集群可不简单,

热心网友
04.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

html中的dialog标签怎么用?
前端开发
html中的dialog标签怎么用?

HTML中的dialog标签怎么用? 很多开发者第一次接触 标签时,都会有个美丽的误会:以为把它写进HTML,页面就会自动弹出一个对话框。其实不然,这个标签的默认状态是“隐藏”的。你可以把它想象成一扇关着的门——写了标签只是造好了门框,想让门打开,你得要么手动加上 open 属性,要么用Ja vaS

热心网友
04.24
如何为响应式下拉菜单添加可点击关闭的“X”按钮
前端开发
如何为响应式下拉菜单添加可点击关闭的“X”按钮

本文介绍如何在基于 CSS 媒体查询和 checkbox 的响应式导航菜单中,通过重构 HTML 结构并结合轻量 Ja vaScript,实现点击汉堡图标展开菜单、再点击右上角“×”按钮即时收起的功能,解决纯 CSS 方案无法主动关闭的问题。 你是否遇到过这样的场景?在移动端,用户点击汉堡图标打开了

热心网友
04.24
如何用 Array.prototype.entries 配合 for...of 在遍历数组的同时获取索引和值
前端开发
如何用 Array.prototype.entries 配合 for...of 在遍历数组的同时获取索引和值

如何用 Array prototype entries 配合 for of 在遍历数组的同时获取索引和值 entries() 返回的是什么类型的迭代器 先说清楚一个核心概念:Array prototype entries() 返回的,是一个标准的数组迭代器对象。这意味着,每次调用它的 next(

热心网友
04.24
伊朗驳斥特朗普所谓分裂内斗
web3.0
伊朗驳斥特朗普所谓分裂内斗

伊朗驳斥特朗普所谓“分裂内斗”论调:美方言论被指为心理投射 近日,围绕伊朗国内局势的表述,美伊之间再次上演了一场外交言辞交锋。这场对话的焦点,似乎已悄然发生了转移。 谈判重心的转向与核心关切的明确 根据伊朗外交部发言人纳赛尔·卡纳尼的表态,一个关键信号已经释放:当前伊美谈判的重心,已不再局限于核问题

热心网友
04.24
HTML怎么做复古风格_html复古怀旧风格页面实现【手册】
前端开发
HTML怎么做复古风格_html复古怀旧风格页面实现【手册】

真正复古的CRT效果需叠加扫描线与亚像素抖动:用repeating-linear-gradient生成2px间距、rgba(0,0,0,0 08)透明度的黑色条纹层,并配以transform: translateX(0 5px) translateY(-0 3px)和steps(1)动画,辅以bac

热心网友
04.24