国产芯片转向系统协同,满足推理需求爆发新阶段

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
经过2025年的发展,大模型行业逐渐形成一个共识:推理需求将步入复合倍速增长阶段,市场需要更高性能和更优性价比的芯片来支撑发展。基于此,1月27日,汤商汤集团孵化的半导体公司曦望发布第三代推理GPU芯片启明S3,并设定了将百万token推理成本降至一分钱左右的清晰目标。
谈及为何选择此时专注于推理方向,曦望董事长徐冰指出,行业风向的转变是驱动这一决策的核心原因:应用需求正从“能训练”向“能用起来”延展;场景也变得更加多元,多模态应用迎来爆发增长,智能体(Agent)需要高频响应与实时交互,物理AI(Physical AI)的落地步伐也在不断加快;成本结构同样发生剧变,行业已开始将推理成本从“元级”压缩至“分级”。未来,人工智能将像水电一样,成为普惠性的数字基础设施。
截至目前,曦望共推出了三款芯片,分别为定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及此次发布的S3。对于未来在训练与推理两端的资源投入分配,徐冰在采访中对记者表示,这是公司战略定力的问题。他指出,若能先将推理做到极致,同样能够在商业层面建立牢固的优势。预计到2030年,推理芯片将占到公司资源分配的80%。
而训推一体芯片本身也存在一定的挑战,曦望联席CEO王勇将其归纳为三大困境:高昂的成本与不稳定的供应;惊人的能耗水平;以及复杂的部署运维流程。未来,合理的算力访存比将成为芯片竞争的关键指标。算力访存比是衡量芯片计算能力与内部数据传输效率匹配度的核心尺度,它直接决定了芯片实际性能的发挥程度。
过去,芯片行业竞争的核心是“堆算力”。然而,随着推理算力需求爆发,“内存墙”问题逐渐凸显,成为制约芯片性能的主要瓶颈。计算单元算力的提升速度,远快于访存带宽的升级步伐,导致许多芯片的理论算力在实际场景中难以充分释放,这一矛盾在推理芯片中尤为突出。为应对这一挑战,英伟达创始人黄仁勋提出了从单芯片优化升级转向系统级协同设计的方案,这也是其下一代Vera Rubin平台的核心设计逻辑。
王勇对此有类似观察。他对记者表示,当前以深度求索为代表的大模型公司,不仅会持续研发大模型,也会推动底层框架的演变。这将带动从模型架构、算子开发到推理系统的全链路技术创新,推动软件框架适配新的计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的深度依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与多家主流大模型进行深度适配,从软件和系统层面着手,全面提升芯片的利用效率。
燧曜智算董事长兼CEO周璟璟表示,国产芯片的定位正变得越来越清晰精准——从最初追求与国际高性能算力并驾齐驱,发展到如今在追求性能的同时,也追求极致的成本控制。国际经验表明,每当百万token的成本下降一半,市场上AI应用的数量就会出现显著增长,算力市场的繁荣度也将呈指数级提升。目前,国产算力正处于一个非常有利的战略位置。
相关攻略
IT之家 3 月 19 日消息,英伟达今日宣布,为 GeForce NOW 带来一轮更新,内容分为两部分:新增游戏、VR 串流体验升级。新加入的游戏包括 Pearl Abyss 开发的开放世界作品《
IT之家 3 月 27 日消息,YouTube 频道 Red Gaming Tech 在最新一期视频中,爆料称相比较 RTX 50 系列,英伟达 RTX 60 系列显卡纯光栅性能提升约 30~35%
IT之家 3 月 28 日消息,据中国台湾地区媒体《电子时报》昨天报道,随着 2026 年第二季度将至,越来越多集成电路设计大厂跳出来直言,先进制程产能在云端 AI 的庞大需求下变得越来越吃紧,3n
文 | 深流研究所,作者 | 绛枫2025年12月,黄仁勋做客Joe Rogan播客,承认自己一直处于焦虑状态。他说了一句用了三十多年的老话—— "英伟达离倒闭永远只有30天 ",然后补了一句很少有人注
“500人的技术团队投入,换不来与谷歌、英伟达同台竞技的话语权。” 作者丨刘伊伦 编辑丨包永刚 “超节点互联协议生态的碎片化,正成为制约其规模化部署的核心瓶颈。”奇异摩尔CEO田陌晨说
热门专题
热门推荐
可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存
3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A
南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天
来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年
大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确





