AI原生时代来临,商汤大装置如何重塑算力集群架构
近日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
商汤大装置首席架构师项铁尧受邀出席研讨会,并发表《商汤大装置AI原生云基础设施探索与实践》主题演讲,系统阐述了商汤大装置对AI原生时代算力集群建设的前沿判断与实践路径——如何将软硬件能力真正转化为客户可用、易用、高效的算力服务。
在他看来,当算力集群的发展进入AI原生时代,新的架构范式应具备统一的规范、极致弹性的扩缩容机制以及为大模型训练和推理深度优化的AI集群runtime。

01. AI算力池:面向角色、水平分层、资源自由流转
项铁尧从底层技术视角切入,指出Kubernetes(全球最流行的容器编排平台)正朝着AI方向发展。
随着动态资源分配(DRA)、Workload API与Gateway API三项核心新特性的引入,K8s逐渐从简单的容器编排工具,进化为AI时代的操作系统。这背后,其实是整个行业在加速从云原生集群时代向AI原生时代跃迁。
围绕上述转变过程,项铁尧重点介绍了商汤大装置前瞻打造的核心产品——AI算力池。
据了解,AI算力池面向AI原生时代全新算力服务需求,采用"三明治"水平分层架构,从底层高度优化的计算网络存储基础设施,到中间层全新的虚拟集群技术,再到上层涵盖开发机、训练平台、部署平台及Agentic Engine的完整PaaS产品体系,全面杜绝不同产品之间的资源孤岛问题。

其中,大装置AI算力池具备三大优势:
1)面向角色。面对客户内部角色多元、需求复杂的现实,分别设计服务形态、提供差异化的解决方案。比如针对集群管理员与平台工程师提供高弹性虚拟集群资源;针对AI研究员,可提供丰富的脚本工具与高效研发环境等等。
2)水平分层。AI算力池采用“三明治”结构,杜绝产品间信息、资源孤岛的可能。
3)资源自由流转。用户只需购买一种通用算力形态,即可在虚拟机、虚拟集群、AI Code Space开发机等不同产品形态之间秒级自由切换,充分应对国内普遍存在的算力潮汐效应,大幅提升集群整体资源利用率。
02虚拟集群:全量托管,秒级弹性扩缩容
值得一提的是,在底层Infra层,商汤大装置创新应用虚拟集群技术,解决了传统云托管服务中“数据面管理重、扩容慢”的痛点。
有别于主流云厂商仅托管控制面,数据面仍需用户自行管理的传统模式,全新的虚拟集群技术,实现了控制面与数据面的全量托管,扩缩容效率从传统方案的数分钟乃至数十分钟压缩至秒级,同时提供完全标准的K8s API,用户无需对现有代码做任何修改即可无缝接入。
03三大自研套件:护航超大规模AI训练与推理
在虚拟集群基础上,项铁尧进一步提出AI集群Runtime产品概念。
“要快速搭建一个离线混部、训练推理混合使用的集群非常复杂,因为现在AI新的技术层出不穷,各种组件之间协同优化同样复杂。”项铁尧指出,“为了解决这种难题,我们通过智能推荐、深度调优与版本锁定机制,帮助用户快速搭建复杂的在离线混部、训练推理混合使用集群,降低AI基础设施的使用门槛与运维复杂度。”
为了进一步满足超大规模AI生产场景的极致性能需求,商汤大装置还自研了三大套件:
1)SenseCore Scheduler:高性能调度器,支持复杂异构硬件的在离线混合调度。
2)容错引擎:解决超大规模训练中的不稳定性,实现故障自动检测与隔离。
3)Agentic Engine:针对不断涌现的Agent使用需求,进行深入优化,包括沙箱预热、快速启动、规划保持、状态快照等。
04虚拟节点:打通弹性算力最后一环
为了以更灵活的规格为客户提供算力资源,商汤大装置同步自研虚拟节点技术,它具备三大优势:
1)虚拟集群体系无缝集成;
2)提供相比于虚拟机更轻量级的使用体验以及更高效的性能;
3)提供相比于runc更好的安全性和隔离度。
05生态合作,共同助推国产推理基础设施迭代
演讲中,项铁尧还特别感谢九源智能计算系统生态联合体与生态伙伴趋境科技。
目前,商汤大装置已与趋境科技展开深度合作,为趋境科技自研的ATaaS高效能AI Token生产服务平台提供高性能、高可靠的算力支撑。
据了解,趋境ATaaS高效能AI Token生产服务平台可支撑万级别AI推理需求,并达到日均万亿级别Token整体产能。
在生态联盟层面,商汤大装置作为九源智能计算系统生态联合体理事单位,积极参与这一以"产学研用服"协同合作为核心模式的开放生态。
该联合体聚焦国产智能计算系统建设、软件生态统一与技术成果转化,致力于构建自主可控的智能计算产业生态。商汤大装置加入其中,希望以自身在AI基础设施领域的积累,为整个生态贡献实质性力量,推动AI能力真正走向普惠。
未来,商汤大装置将进一步联合生态伙伴,共同推动国产推理基础设施迭代升级,为我国人工智能产业高质量发展、新质生产力落地提供坚实支撑。
转载来源:商汤科技
相关攻略
近日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。商汤大装置首席架构师项铁
图片由AI生成当大模型的竞争焦点从参数竞赛转向落地实效比拼,真正将技术转化为生产力,成为了行业内玩家的核心命题。作为中国AI领域的先行者,商汤科技最新发布的2025年业绩报告,也是一份关于AI产品化
智东西作者|江宇编辑|漠影智东西3月26日报道,昨日,中国计算机学会(CCF)发布声明,强烈反对NeurIPS新增限制条款,并倡议中国学者暂停投稿与审稿。▲中国计算机学会发布声明强烈反对并发起抵制这
近日,商汤大装置联合大晓机器人与广西产业技术研究院达成战略合作,就AI基础设施建设、具身数据采集、世界模型研发、机器人应用场景拓展等领域达成深度合作,开启三方携手赋能具身智能产业发展的新篇章。此次战
新京报贝壳财经讯(记者张晓慧)随着AI智能体OpenClaw走红,互联网厂商寻求从各个方向切入这一赛道。3月11日,商汤科技旗下“办公小浣熊”推出可在OpenClaw上部署的办公Skills(功能插
热门专题
热门推荐
4月3日消息,今日,OPPO官微宣布,OPPO Find X9s Pro将首发新一代1nit明眸护眼屏,宣称全场景都护眼。据悉,这块屏幕来自新一代天马天工屏,搭载全新U9 Pro发光基材,从材料、器
Word行距异常增大可按五步解决:一、重置段前段后间距为0并设单倍行距;二、改用固定值行距(如小四号设18磅);三、清除样式继承并修复Normal模板;四、禁用自动格式更正干扰项;
汽车4月3日消息,4月3日,“年轻人第一台GT”比亚迪2026款海豹06GT新车交付仪式在深圳举行,作为海洋网又一搭载第二代刀片电池和最新闪充技术的重磅车型,上市售价12 89万元-16 99万元,
汽车4月3日消息,广汽埃安宣布将于 4 月 16 日举办品牌焕新发布会,埃安 N60 汽车将同步开启预售。目前新车已开启盲订,支付 99 元定金可享价值 5088 元礼遇。该车由曾任职于宝马等品牌的
4月5日消息,一起教育科技(NASDAQ: YQ)日前发布截至2025年12月31日的财报。财报显示,一起教育科技2025年营收为1 06亿(约1520万美元),较上年同期的1 89亿元下降44%。





