首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
曦和发布S3推理GPU芯片:融资30亿后,如何实现算力超车

曦和发布S3推理GPU芯片:融资30亿后,如何实现算力超车

热心网友
41
转载
2026-01-28



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

雷递网 乐天 1月28日

在大模型产业从“训练驱动”走向“推理驱动”的关键拐点上,国产GPU厂商正重新审视算力的商业价值与交付方式。

1月27日,专注于推理 GPU 的曦望(Sunrise)发布新一代推理 GPU 芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也是曦望在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

在国产 GPU 行业逐步从“拼性能参数”转向“拼单位经济性”的背景下,曦望选择将战略重心明确锚定在推理算力这一更具长期确定性的赛道。

从“拼参数”到“算清账”,S3 聚焦推理效率与成本



与强调峰值算力和通用能力的训推一体 GPU 路线不同,曦望在启望S3 芯片上继续强化其“All-in 推理”的定位。

曦望联席CEO王勇在发布会上表示,AI 行业正在进入以应用落地为核心的下半场,推理逐步超越训练,成为主要算力消耗场景。相比训练阶段的一次性高投入,推理更强调长期交付能力、单位成本和系统稳定性,这也正在改变GPU的竞争逻辑。

据介绍,启望S3是一款面向大模型推理深度定制的 GPGPU 芯片,围绕真实推理负载,对芯片架构、存储体系与互联方式进行了系统级设计。相比上一代产品,S3 在典型推理场景下的整体性价比提升超过 10 倍。

在算力与存储设计上,S3 支持从 FP16 到 FP4 的精度自由切换,在保证模型效果的前提下显著提升低精度推理效率;同时率先在国内 GPGPU 产品中采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍,缓解了大模型推理中常见的显存瓶颈问题。

在DeepSeek V3/R1满血版等主流大模型推理场景中,S3 的单位 Token 推理成本较上一代降低约 90%。王勇表示,这使“百万 Token 一分钱”从概念走向可规模化部署的工程能力。

王勇表示,曦望的推理 GPU 并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖 ModelScope 平台 90% 以上主流大模型形态。

围绕启望 S3,曦望同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可高效支撑 PD 分离架构与大规模专家并行(EP)部署,适配千亿、万亿级参数的多模态 MoE 推理场景。

在交付形态上,寰望 SC3 采用全液冷设计,核心能效指标PUE表现极致。曦望方面表示,在同等算力规模下,该方案的整体交付成本控制在千万元级别,相较行业内同类亿元级方案降低一个数量级。

同时,曦望还推出覆盖 PCIe、OAM 模组、一体机及 AI 计算集群在内的 S3 产品矩阵,覆盖从单机推理到大规模集群部署的多样化需求。

不只卖芯片,重构算力交付的推理“云模式”

如果说 S3 回答的是“推理算力如何更便宜”,那么曦望共建的推理云计划,则进一步指向“算力如何更好用”。

随着推理逐渐成为大模型算力消耗的主要来源,推理算力在实际落地中普遍存在资源碎片化、运维复杂、成本不可预测等挑战。相比训练阶段的一次性投入,推理更强调持续交付能力与长期单位成本,这也对算力交付方式提出了新的要求。

在此背景下,曦望通过生态共建推理云视为其推理算力体系中的关键一环。依托自研推理 GPU,曦望实现从底层芯片到上层平台的全栈优化,将硬件能力以平台化方式稳定释放,从而降低模型适配和系统部署复杂度,形成面向应用落地的完整算力交付路径。



曦望联席 CEO 王湛表示,新一代的AI算力平台,应具备软硬件深度协同、资源利用高度弹性、技术门槛低且运行稳定可靠等特征。基于这一判断,曦望通过云化方式对算力交付模式进行重构,使推理算力从“设备能力”转化为可标准化、可规模化的服务能力。

据介绍,共建推理云以启望 S3 为底座,通过 GPU 池化与弹性调度,将分散的算力资源整合为统一的推理算力池,并以 MaaS(Model as a Service)作为核心入口,向企业提供开箱即用的大模型推理服务。企业无需关注底层硬件配置和集群运维,即可按需调用模型能力,并根据业务负载灵活扩展算力规模。

在稳定性与运维层面,共建推理云在千卡级集群场景下可用性达到 99.95%,横向扩展效率超过 95%。

在这一目标之下,曦望联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望方面表示,该计划并非单一产品能力的展示,而是多方围绕推理算力成本形成的协同共识,标志着大模型推理正在从“技术可行”走向“经济可行”,为 AI 应用规模化落地提供清晰的成本锚点。

推理算力走向“系统工程”,生态协同成关键变量

随着推理算力竞争从单点技术走向系统工程能力比拼,产业协同的重要性日益凸显。

中国工程院院士、浙江大学信息学部主任吴汉明在发布会上表示,推理时代的算力竞争,已演进为涵盖芯片、系统架构、软件平台和应用场景的综合能力竞争,需要构建从芯片到系统、从技术到应用的完整创新链条。

发布会现场,曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”,围绕光互连 GPU 超节点架构、半导体虚拟制造(计算光刻)以及 AI 高精度气象预测等前沿方向展开协同研究。

此外,曦望还与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业达成战略合作,推动推理算力在交通、制造、医疗等行业的落地应用。

曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI 产业正从“训练驱动”转向“推理驱动”。相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。

他指出,曦望并不希望只做一家卖芯片的公司,而是围绕推理场景,构建“芯片+系统+生态”的整体布局,让推理算力真正成为可规模化、可持续的基础设施。2025年,曦望芯片交付量已突破万片。

“谁能持续降低推理成本,谁就掌握了 AI 产业的成本曲线。”徐冰表示,曦望希望通过推理算力体系的系统性创新,助力 AI 应用实现规模化落地与可持续增长。

雷递由媒体人雷建平创办,若转载请写明来源。

来源:https://www.163.com/dy/article/KKC077PD0511A0EF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步
科技数码
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步

这项由瑞士洛桑联邦理工学院(EPFL)、意大利卢加诺大学(USI)、韦斯利安大学、巴黎脑研究所(ICM)以及宾夕法尼亚州立大学联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 03480。对这一交叉领域感兴趣的读者,可以通过该编号在arXiv平台上查阅完整原文。 一、

热心网友
04.22
摩尔线程完成智谱GLM-5.1适配
科技数码
摩尔线程完成智谱GLM-5.1适配

北京商报讯(记者 陶凤 王天逸) 人工智能领域又传来一条振奋人心的消息。4月8日,摩尔线程正式宣布,其旗舰级AI训推一体全功能GPU——MTT S5000,已经成功完成了对智谱新一代旗舰模型GLM-5 1的Day-0极速适配。这意味着,推理部署与训练复现的全部流程,现在都能在这条国产算力路径上获得支

热心网友
04.15
如何利用SQL进行推理
数据库
如何利用SQL进行推理

如何用SQL求解逻辑推理题:经典楼层分配谜题实战 今天我们来探讨一个非常有趣的技术应用:使用SQL来求解逻辑推理题。这听起来或许有些大材小用,但正是这种跨界应用,充分展现了SQL语言的强大灵活性以及开发者分析问题的思维能力。我们将以一个经典的五人楼层分配谜题作为案例,逐步拆解如何用纯粹的SQL找到答

热心网友
04.14
AI看图能力真伪探秘:它是否真是编出来的?
科技数码
AI看图能力真伪探秘:它是否真是编出来的?

一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回

热心网友
04.01
智谱CEO张鹏:追求推理极限,推动长效AI发展
科技数码
智谱CEO张鹏:追求推理极限,推动长效AI发展

雷递网 乐天 3月31日智谱CEO张鹏今日在智谱2025年年报沟通会上表示,智谱曾经历过质疑,经历过挫折,但无数事实反复验证了一个判断——智能上界的提升,是大模型AGI时代唯一的 "第一性 "。张鹏说,

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

平安夜给朋友的搞笑祝福语
礼仪与书信
平安夜给朋友的搞笑祝福语

平安夜给朋友的搞笑祝福语 还在为平安夜的祝福语千篇一律而发愁吗?想给朋友来点不一样的惊喜?没问题,这里为你整理了一份专属于朋友的、轻松搞怪的平安夜祝福语合集,保证让你的问候脱颖而出。 1 平安夜,报平安。如果今晚有一段祥和的旋律悄悄流过你的梦境,那可能是我翻山越岭、潜入梦乡的痕迹……今晚务必做个好

热心网友
04.23
平安夜给妹妹的祝福词
礼仪与书信
平安夜给妹妹的祝福词

平安夜给妹妹的祝福语 平安夜就在眼前,想必你正为如何向妹妹传递心意而思量。一份恰到好处的祝福,最能温暖人心。这里为你精心整理了一份祝福语合集,希望能帮你把那份独特的牵挂与美好,准确送达。 1 将“平安”二字拆解:这是你的心愿,也是我的期盼,两者相连,便是一个完美的“同心圆”;你的平安,我的挂念,共

热心网友
04.23
亚马逊狗狗币是啥?揭开迷雾背后的真相
web3.0
亚马逊狗狗币是啥?揭开迷雾背后的真相

亚马逊狗狗币是啥?揭开迷雾背后的真相 在加密货币的世界里,各种新名词总是层出不穷。最近,“亚马逊狗狗币”这个词时不时就在社媒和论坛里冒出来,勾起了不少人的好奇心:这难道是电商巨头亚马逊亲自下场发行的官方狗狗币?还是某种跟亚马逊绑定的新玩意儿?真相是,“亚马逊狗狗币”并非亚马逊的官方产物,它更多反映了

热心网友
04.23
平安夜给好友的留言
礼仪与书信
平安夜给好友的留言

平安夜就要到了,想好怎么给好朋友留言了吗? 这里为你整理了一份温馨又走心的平安夜留言合集,希望能给你带来灵感。选一句最合心意的,为你的好友送上专属祝福吧! 精选平安夜祝福留言 1 星星悄悄划过夜空,就像我悄悄落下的思念。千言万语,其实只想说一句:平安夜快乐! 2 愿平安夜摇曳的烛光,能点亮你新一

热心网友
04.23
平安夜祝福语句
礼仪与书信
平安夜祝福语句

平安夜祝福语精选:让温暖与欢乐在字里行间流淌 平安夜,这个充满温馨与期盼的节日,总是承载着无数美好的祝愿。无论是送给亲人、爱人还是朋友,一句真挚的祝福便能瞬间拉近彼此的距离。下面为大家整理了一系列风格多样的平安夜祝福语,希望能为你的节日问候增添灵感与暖意。 平安夜祝福语(一) 1 宝宝,平安夜又要

热心网友
04.23