游乐游手机版
首页/科技数码/文章详情

AI成本剧变:从烧钱到精算,节点普惠如何破局降本?

时间:2026-03-28 12:49
来源:环球网【环球网科技报道 记者 李文瑶】当AI技术从技术验证走向实际应用,算力供给的结构性调整正成为业界关注的焦点。3月26日,中关村论坛年会现场,中科曙光发布世界首个无线缆箱式超节点——sca

来源:环球网

【环球网科技报道 记者 李文瑶】当AI技术从技术验证走向实际应用,算力供给的结构性调整正成为业界关注的焦点。

3月26日,中关村论坛年会现场,中科曙光发布世界首个无线缆箱式超节点——scaleX40。这款产品集成40张GPU,总算力超过28PFLOPS(FP8精度)。中科曙光高级副总裁李斌在发布会上表示,推出这一产品的初衷,是为了“补齐市场上的产品空缺”——在数百卡级的顶级超节点与当前主流的8卡服务器之间,寻找一个兼具性能与成本优势的“最佳收益点”。


“原来的超节点太过高配,而主力用于推理服务的8卡形态又已落伍。”李斌在接受记者采访时说。在他看来,随着以OpenClaw为代表的智能体技术快速兴起,AI算力使用模式正从以训练为主转向以推理和服务为主,算力基础设施的角色也相应地从“算力工厂”转变为“Token工厂”。在这一背景下,如何让超节点从“少数人的能力”变成“多数人的标配”,成为行业需要回答的问题。

算力需求的结构性变化

过去几年,AI算力的叙事主线是“越大越好”——更大的集群、更多的卡数、更高的参数规模。从千卡到万卡,再到十万卡集群,头部科技公司竞相追逐算力规模的极限。

但这一逻辑正在被市场需求的变化所修正。

“从当前市场需求来看,AI算力结构正在发生分层变化。”中科曙光高级副总裁李斌在发布会上表示。根据行业机构预测,全球AI基础设施投入仍将保持较快增长,但新增需求正逐步从超大规模集群,转向企业级和行业应用场景。

这意味着,算力配置的重点不再单纯追求规模上限,而是更加关注性能、成本与灵活性的平衡。

智源研究院AI框架研发部门负责人敖玉龙在圆桌对话中道出了科研机构面临的现实困境:“算法同学最理想的情况是,用一台机器就像用单机一样,不需要了解复杂的并行策略和优化策略。但现实是,大模型的规模决定了不可避免地需要一个复杂的系统。”

超节点的技术逻辑

也是在这一背景下,中科曙光选择了40卡这一规模作为切入点。

“业内普遍共识是:几十卡规模已足够满足大多数行业场景模型训练、推理及开发测试的算力需求,这也是兼顾效率与投入的最大公约数区间。”李斌解释,相比数百卡级的顶级超节点,40卡既具备支撑大模型训练和推理的能力,又不会带来过重的投入压力。

从技术路径来看,scaleX40采用了与顶级超节点不同的设计思路。它通过无线缆正交架构,将计算与交换节点实现直接对插,减少了光纤与铜缆的使用,同时采用标准19英寸箱式设计,可直接适配现有数据中心环境。

这种设计带来的直接影响是部署门槛的大幅降低。“原来的超节点基本上以柜为单位,而且是定制化系统,对整个机房的供电、环境要求非常高。”李斌在采访中表示,而scaleX40作为箱式系统,可以放在标准机柜里,接标准机房的供电和冷却设备。

在性能层面,scaleX40的通信效率提供了具体的数据支撑。与传统的5台8卡机相比,访存带宽超过80TB/s,提升约10到20倍,延迟降低接近一个数量级。更重要的是,40卡之间采用的是地址可直接访问的内存语义,而非传统网络传输模式,这在编程和使用上带来了实质性便利。

成本与收益的平衡点

对于大多数企业而言,算力决策的核心始终是投入产出比。

中科曙光方面给出的数据是:与传统5台8卡机相比,scaleX40的成本基本相当;但训练性能可提升120%,推理性能最高提升至330%。与组合柜式超节点相比,部署和采购门槛则有数量级的下降。

“普惠算力最直接的体现是,花同样的钱,得到4到5倍的收益。”李斌如此说道。

这种性价比优势的背后,是全栈协同优化的结果。从存储到网络,从管理平台到软件栈,scaleX40并非一个孤立的硬件产品。发布现场,中科曙光展示了与之配套的ParaStor分布式存储系统、ScaleFabric高速网络产品以及SothisAI开发管理平台。

“scaleX40不仅仅是一台机器,更是一套开箱即用的系统产品。”曙光信息产业(北京)有限公司副总裁李柳强调。系统出厂前已针对推理、训练等场景完成常用算子及软硬件的深度优化,并内置800多个完成适配的常用大模型。

从“技术竞赛”到“产业融合”

值得关注的是,scaleX40的发布时机恰逢AI应用形态的转折点。

年初以来,以OpenClaw为代表的智能体技术快速走热,推动AI从“对话”走向“行动”。这一变化对算力供给提出了新的要求——不再只是单次响应的速度,而是并发能力、稳定性和单位Token产出成本的综合考量。

“Token需要算力来做产出,但现在的评价维度和指标变得更多了。”李斌分析,对普通用户来说是响应速度,对算力系统运营者来说是并发支撑能力,而scaleX40正是希望在多个方面同时带来提升。

这种变化也反映在行业对算力形态的预期上。中国电信股份有限公司研究院云网融合技术研究所智算网络技术负责人王子潇提出,未来3—5年算力与应用的协同优化将越来越紧密,模型结构逐步收敛后,针对特定算子的ASIC芯片会快速发展。而在互连层面,Scale-up和Scale-out协议的统一可能带来节点规模扩张的更大灵活性。

算力供给的未来路径

从更宏观的视角看,中国算力产业正在经历的系统性转变。“现在国家对于算力中心建设总体的指导思想是让这些建设更有序、更集约、更绿色。”李斌表示,在去年发布面向顶级训练的scaleX640之后,如今推出面向普惠应用的scaleX40,形成从尖端到普惠的产品矩阵,这是算力分层供给逻辑的自然延伸。

在自主创新层面,中科曙光强调系统级协同优化的路径。“我们在整个国内计算AI生态里,跟上下游从芯片到系统软件,再到上层模型和应用,在做垂直的跨层协同。”李斌说道,通过这种协同去发挥更好的效率,体现的是产业链、生态链协同创新的方向。

当前,AI正加速进入千行百业。在这个过程中,算力能否以更低的门槛、更高的效率、更可控的成本实现供给,将直接影响AI应用的广度和深度。正如李斌所言:“我们希望让这个产品成为当前支撑模型推理服务最重要的生产力工具。”

来源:https://www.163.com/dy/article/KP3TPQSM0514R9OJ.html
上一篇美国宇航员太空撤离真相:突发失语20分钟,病因仍未查明 下一篇地缘政治与半导体产业链:韩国化学品及光刻材料供应冲击
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo