软银集团推出NeoCloud服务:瞄准大模型算力蓝海,重构AI基础设施格局
2025年7月2日,软银集团旗下子公司软银公司SB NEO正式发布NeoCloud服务,这一全新云服务产品剑指美国超大规模云厂商的大语言模型训练与推理需求。据全链网报道,NeoCloud的定位极为明确——为那些急需海量GPU计算资源的顶尖云平台提供专业化、高密度的算力支持。这一举措被业内视为软银在AI基础设施赛道的重磅落子,也预示着云服务市场正从“通用计算”向“AI专用算力”深度分化。
大模型算力“硬骨头”:为何一般云服务商难以啃下?
大语言模型的训练与推理对计算资源的要求极为苛刻。以GPT-4级别的模型为例,单次训练往往需要上万张高端GPU卡(如NVIDIA H100或A100)持续运行数周甚至数月。这不仅涉及GPU芯片本身的成本,更考验高带宽网络架构、低延迟存储系统以及大规模并行调度能力。传统的通用云服务商在资源弹性、网络拓扑优化和散热管理方面往往难以满足超大规模集群的需求,导致训练效率下降、成本飙升。
据IDC最新数据显示,2025年全球AI算力市场规模预计突破800亿美元,其中大模型训练算力占比超过40%。然而,头部云厂商(如AWS、Azure、Google Cloud)自用算力已趋饱和,第三方独立算力服务商的供给缺口正持续扩大。软银正是在这一窗口期推出NeoCloud,意图填补“超大规模云厂商之外的高性能算力空白”。
NeoCloud核心优势:软银的算力野心与差异化布局
软银此次并非仓促入场。SB NEO此前已在日本本土积累了丰富的边缘计算与数据中心运营经验,其在美国部署的NeoCloud服务将依托软银全球IDC网络及与英伟达等芯片厂商的深度合作,提供从GPU集群租赁、训练平台托管到推理加速的一站式解决方案。具体能力包括:
- 大规模GPU集群:支持数千张H100或最新B200芯片的并行计算,并通过自研高速互联技术降低通信延迟。
- 弹性算力调度:基于智能调度系统,用户可根据训练任务动态调整算力配置,按秒计费,降低闲置成本。
- 专用推理优化:针对大模型推理场景提供低精度量化、模型剪枝等硬件级加速,使响应速度提升3倍以上。
- 合规与安全:符合美国《芯片法案》及数据隐私法规,保障用户模型权重与训练数据的私有性。
软银集团CEO孙正义在内部声明中强调:“NeoCloud不是简单的算力转售,而是针对AI原生需求重新设计的云基础设施。” 这一表态直接对标微软、亚马逊等自研AI芯片的巨头,显示出软银以“开放算力池”策略切入市场的决心。
市场竞争格局:NeoCloud能否撼动既有格局?
目前美国超大规模云厂商的算力供应商主要包括CoreWeave、Lambda Labs、Vultr等专业GPU云服务商。例如CoreWeave在2024年已获得微软数十亿美元的算力订单,其市场份额快速增长。软银NeoCloud的入局,将面临与这些老牌玩家的直接竞争。但软银拥有独特的资源优势:
- 资本实力:软银愿景基金可调配资金超过1000亿美元,足以支撑长期重资产投入。
- 全球客户网络:软银投资的众多AI初创公司(如OpenAI早期支持者)可能成为首批种子用户。
- 技术生态:与英伟达、AMD等芯片厂商的战略合作,可确保GPU优先供货和技术集成。
然而,挑战同样存在:美国算力基础设施审批流程复杂,数据中心电力供应与环保问题日益突出。软银需在选址、绿电使用及社区关系方面投入额外成本。
行业洞察:大模型算力“瓶颈”倒逼服务模式创新
从更宏观的视角看,NeoCloud的推出是AI产业链垂直分工加速的缩影。以往云厂商“通吃”IaaS、PaaS、SaaS的模式逐渐被打破,专业算力服务商开始聚焦于“算力即服务”(CaaS)这一细分赛道。据Gartner预测,到2027年,超过60%的企业级大模型训练将委托给第三方专用算力服务商,而非自建集群。
软银选择此时入局,既是对趋势的精准把握,也与其投资组合高度协同。例如,软银投资的Cohere、Perplexity AI等大模型公司,正面临算力成本高企的困扰。NeoCloud若能提供比AWS更低30%的单价,将直接增强这些被投企业的竞争力。此外,软银还在探索算力与Web3分布式计算网络的融合,未来或通过区块链技术实现GPU资源的去中心化调度,进一步降低算力门槛。
后续关注点:NeoCloud的实际性能与商业化进展
当前NeoCloud服务仍处于早期上线阶段,其宣称的算力规模、PUE(电源使用效率)以及训练任务的完成时间等关键指标尚未公开。业内期待软银能提供独立的第三方基准测试数据(如MLPerf结果),以验证其在真实大模型训练场景下的表现。同时,定价策略与客户签约情况将是判断其商业化成功程度的核心指标。
除美国市场外,软银还计划在欧洲和亚太地区复制NeoCloud模式。考虑到日本、韩国等地对AI算力的旺盛需求,以及软银在本土的政策优势,NeoCloud的全球化落地速度同样值得持续追踪。总体而言,软银NeoCloud的推出,不仅为AI产业注入了新的算力供给,更可能引发一场云服务架构范式之争——是继续依赖巨头封闭生态,还是拥抱开放、专用的算力基础设施?答案将在未来12个月内逐渐明朗。
本文由全链网报道整理,数据来源包括IDC、Gartner及公开财报信息。内容仅供参考,不构成投资建议。
