首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
国产芯片转向系统协同,满足推理需求爆发新阶段

国产芯片转向系统协同,满足推理需求爆发新阶段

热心网友
15
转载
2026-01-27


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

经过2025年的发展,大模型行业逐渐形成一个共识:推理需求将步入复合倍速增长阶段,市场需要更高性能和更优性价比的芯片来支撑发展。基于此,1月27日,汤商汤集团孵化的半导体公司曦望发布第三代推理GPU芯片启明S3,并设定了将百万token推理成本降至一分钱左右的清晰目标。

谈及为何选择此时专注于推理方向,曦望董事长徐冰指出,行业风向的转变是驱动这一决策的核心原因:应用需求正从“能训练”向“能用起来”延展;场景也变得更加多元,多模态应用迎来爆发增长,智能体(Agent)需要高频响应与实时交互,物理AI(Physical AI)的落地步伐也在不断加快;成本结构同样发生剧变,行业已开始将推理成本从“元级”压缩至“分级”。未来,人工智能将像水电一样,成为普惠性的数字基础设施。

截至目前,曦望共推出了三款芯片,分别为定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及此次发布的S3。对于未来在训练与推理两端的资源投入分配,徐冰在采访中对记者表示,这是公司战略定力的问题。他指出,若能先将推理做到极致,同样能够在商业层面建立牢固的优势。预计到2030年,推理芯片将占到公司资源分配的80%。

而训推一体芯片本身也存在一定的挑战,曦望联席CEO王勇将其归纳为三大困境:高昂的成本与不稳定的供应;惊人的能耗水平;以及复杂的部署运维流程。未来,合理的算力访存比将成为芯片竞争的关键指标。算力访存比是衡量芯片计算能力与内部数据传输效率匹配度的核心尺度,它直接决定了芯片实际性能的发挥程度。

过去,芯片行业竞争的核心是“堆算力”。然而,随着推理算力需求爆发,“内存墙”问题逐渐凸显,成为制约芯片性能的主要瓶颈。计算单元算力的提升速度,远快于访存带宽的升级步伐,导致许多芯片的理论算力在实际场景中难以充分释放,这一矛盾在推理芯片中尤为突出。为应对这一挑战,英伟达创始人黄仁勋提出了从单芯片优化升级转向系统级协同设计的方案,这也是其下一代Vera Rubin平台的核心设计逻辑。

王勇对此有类似观察。他对记者表示,当前以深度求索为代表的大模型公司,不仅会持续研发大模型,也会推动底层框架的演变。这将带动从模型架构、算子开发到推理系统的全链路技术创新,推动软件框架适配新的计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的深度依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与多家主流大模型进行深度适配,从软件和系统层面着手,全面提升芯片的利用效率。

燧曜智算董事长兼CEO周璟璟表示,国产芯片的定位正变得越来越清晰精准——从最初追求与国际高性能算力并驾齐驱,发展到如今在追求性能的同时,也追求极致的成本控制。国际经验表明,每当百万token的成本下降一半,市场上AI应用的数量就会出现显著增长,算力市场的繁荣度也将呈指数级提升。目前,国产算力正处于一个非常有利的战略位置。

来源:https://www.163.com/dy/article/KKA9MPV50519DDQ2.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达高管称AI成本高于人力 为何企业裁员仍在继续
科技数码
英伟达高管称AI成本高于人力 为何企业裁员仍在继续

当前企业热衷用AI替代人力并因此裁员,但英伟达和Uber高管指出AI运行成本远超人力,研究也显示多数场景人工更优且成本更低。然而,企业仍坚定推进AI替代,看重其全天候运行能力,并加速用AI生成代码、削减岗位。这场成本与效率的博弈仍在持续。

热心网友
05.14
英伟达颠覆性成果重新定义RAG外部检索必要性
AI
英伟达颠覆性成果重新定义RAG外部检索必要性

说到RAG(检索增强生成),大家可能已经习惯了它的标准工作流程:先用一个检索模型从海量文档里捞出一批“相关”内容,再交给大语言模型去消化、生成答案。这个流程看似顺畅,但其实一直埋着一个根本性的问题,只是我们习以为常了。 这个问题就是:检索器和生成器,其实是在两个完全不同的“世界”里工作。 检索器,无

热心网友
05.14
英伟达市值超德国GDP 解析其中国投资布局与战略
科技数码
英伟达市值超德国GDP 解析其中国投资布局与战略

五月中旬,英伟达市值突破5 5万亿美元,超越德国2025年名义GDP,成为全球首家市值超过单一发达经济体的上市公司。这反映了人工智能浪潮带来的巨大能量重构。英伟达自2004年起在中国设立多家公司,已构建完整的业务网络。市值里程碑背后,是AI算力赛道价值获得空前认可的缩影。

热心网友
05.14
英伟达CEO称旧款GPU因AI需求涨价,算力供需失衡加剧
iphone
英伟达CEO称旧款GPU因AI需求涨价,算力供需失衡加剧

在AI需求爆发的背景下,GPU市场出现供需严重失衡。英伟达CEO黄仁勋将旧款GPU价格持续上涨的现象比喻为“好酒效应”,指出其升值速度甚至超过葡萄酒陈化。核心原因在于全球AI业务对算力的巨大需求,使得数据中心极度依赖GPU。这种需求从上游芯片制造到下游云服务贯穿整个产业链,导致包括四五年前旧型号在内

热心网友
05.14
谷歌与英伟达谁将问鼎全球市值第一
科技数码
谷歌与英伟达谁将问鼎全球市值第一

来源:环球时报 【环球时报特约记者 甄翔】资本市场近日上演了一场引人注目的“王座”争夺战。谷歌母公司Alphabet在美股盘后交易时段,市值一度超越英伟达,这意味着它在阔别大约十年后,短暂地重返了全球市值冠军的宝座。回顾过去一年,Alphabet的股价表现堪称惊艳,累计飙升了160%。截至上周五收盘

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14