国产芯片转向系统协同，满足推理需求爆发新阶段

时间：2026-01-27 21:01

大模型经过2025年的发展，行业逐渐形成共识：推理需求将以复合倍速增长，行业需要高性能、高性价比的芯片。基于此，1月27日，自商汤集团孵化而生的半导体公司曦望发布第三代推理GPU芯片启望S3，设定将

经过2025年的发展，大模型行业逐渐形成一个共识：推理需求将步入复合倍速增长阶段，市场需要更高性能和更优性价比的芯片来支撑发展。基于此，1月27日，汤商汤集团孵化的半导体公司曦望发布第三代推理GPU芯片启明S3，并设定了将百万token推理成本降至一分钱左右的清晰目标。

谈及为何选择此时专注于推理方向，曦望董事长徐冰指出，行业风向的转变是驱动这一决策的核心原因：应用需求正从“能训练”向“能用起来”延展；场景也变得更加多元，多模态应用迎来爆发增长，智能体（Agent）需要高频响应与实时交互，物理AI（Physical AI）的落地步伐也在不断加快；成本结构同样发生剧变，行业已开始将推理成本从“元级”压缩至“分级”。未来，人工智能将像水电一样，成为普惠性的数字基础设施。

截至目前，曦望共推出了三款芯片，分别为定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2，以及此次发布的S3。对于未来在训练与推理两端的资源投入分配，徐冰在采访中对记者表示，这是公司战略定力的问题。他指出，若能先将推理做到极致，同样能够在商业层面建立牢固的优势。预计到2030年，推理芯片将占到公司资源分配的80%。

而训推一体芯片本身也存在一定的挑战，曦望联席CEO王勇将其归纳为三大困境：高昂的成本与不稳定的供应；惊人的能耗水平；以及复杂的部署运维流程。未来，合理的算力访存比将成为芯片竞争的关键指标。算力访存比是衡量芯片计算能力与内部数据传输效率匹配度的核心尺度，它直接决定了芯片实际性能的发挥程度。

过去，芯片行业竞争的核心是“堆算力”。然而，随着推理算力需求爆发，“内存墙”问题逐渐凸显，成为制约芯片性能的主要瓶颈。计算单元算力的提升速度，远快于访存带宽的升级步伐，导致许多芯片的理论算力在实际场景中难以充分释放，这一矛盾在推理芯片中尤为突出。为应对这一挑战，英伟达创始人黄仁勋提出了从单芯片优化升级转向系统级协同设计的方案，这也是其下一代Vera Rubin平台的核心设计逻辑。

王勇对此有类似观察。他对记者表示，当前以深度求索为代表的大模型公司，不仅会持续研发大模型，也会推动底层框架的演变。这将带动从模型架构、算子开发到推理系统的全链路技术创新，推动软件框架适配新的计算范式与跨硬件部署，试图摆脱对英伟达CUDA生态的深度依赖。此次曦望也发布了AI算力平台，以自研芯片为底座，与多家主流大模型进行深度适配，从软件和系统层面着手，全面提升芯片的利用效率。

燧曜智算董事长兼CEO周璟璟表示，国产芯片的定位正变得越来越清晰精准——从最初追求与国际高性能算力并驾齐驱，发展到如今在追求性能的同时，也追求极致的成本控制。国际经验表明，每当百万token的成本下降一半，市场上AI应用的数量就会出现显著增长，算力市场的繁荣度也将呈指数级提升。目前，国产算力正处于一个非常有利的战略位置。

来源：https://www.163.com/dy/article/KKA9MPV50519DDQ2.html

英伟达单芯片堆算力国产芯片推理需求

上一篇澳门汇聚中外专家，探讨太空与行星科学前沿 下一篇周鸿祎锐评罗永浩：天生狂傲，见谁怼谁的性格剖析

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5

科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起，两项关乎电动汽车安全的核心强制性国家标准将正式实施，为行业加装“安全锁”——《电动汽车安全要求》（GB 18384-2025）与《电动汽车用动力蓄电池安全要求》（GB 38031-2025）同步落地。此次标准升级，从整车架构与电池系统两大维度，精准填补了近年来多起事故暴露出的