游乐游手机版
首页/科技数码/文章详情

云天数智发布AI芯片战略:大算力芯片未来三年规划

时间:2026-02-04 10:37
“我们正在全面进入AI应用大规模落地的阶段,需要的是更高性价比的推理芯片。”云天励飞董事长兼CEO陈宁强调。2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯

“我们正全面迈入AI应用大规模落地的关键时期,真正需要的是更高性价比的推理芯片。”云天天励飞董事长兼CEO陈宁这样强调。

2月3日,云天天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布了未来三年的大算力AI推理芯片战略布局。公司计划将核心研发资源集中于攻克大模型落地面临的“成本壁垒”,通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标,以此推动AI技术从“技术尝鲜”走向“普惠生产力”。

加速布局推理算力

当前,全球算力产业的发展风向正加速向推理侧倾斜。

谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,并强调其在大规模推理效能上的系统性优化。

与此同时,产业整合的步伐也在加快。2025年12月,英伟达与推理芯片企业Groq达成非独占许可安排,通过支付许可费的方式获得了Groq推理技术的授权,并吸纳其核心工程人才团队加入,以强化其在推理与实时工作负载方面的能力。

云天天励飞高管指出,推理侧的竞争已不再是单纯“把模型做得更强”的参数竞赛,而是转向“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。

“我们的目标是将百万TOKEN的成本每年降低100倍。到2030年,我们要实现百亿TOKEN成本仅一元人民币,只有到那时,才是一场真正的工业革命。”陈宁表示。

架构创新

面对推理时代对系统级协同的迫切需求,云天天励飞确立了GPNPU技术路线,并提出了“GPNPU=GPGPU+NPU+3D堆叠存储”的组合架构。这一设计旨在兼顾通用计算的“通用性”与NPU的“高效性”,从工程层面解决可迁移、可部署、可持续降本三大难题。

具体来看,在通用生态层面,云天天励飞的GPNPU架构将兼容CUDA架构,实现一行代码完成CUDA程序兼容,大幅降低了用户进入生产系统的门槛。

在推理能效层面,NPU能够实现更高的计算效率和能效比。面对大模型推理这种高度结构化、可被体系化优化的负载,专用设计带来的能效优势更容易转化为真实的成本优势,这也是国际厂商持续加码专用路线的重要原因。

针对业界公认的“内存墙”瓶颈,云天天励飞正深度研发3D堆叠存储及更前沿的互联技术,以显著提升带宽与能效,有效降低推理时延。

在架构工程与产品化路径上,云天天励飞采取“算力积木”架构。即通过Chiplet扩展与互联思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态;同时,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的综合最优解。

打造全场景算力矩阵

面向未来三年的规划,云天天励飞CTO李爱军表示,公司将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。

云天天励飞路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时解码码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。

陈宁在演讲中将公司核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。

去年,云天天励飞进行了“1+4”架构调整:“1”指聚焦于AI大算力推理芯片,“4”则是四大事业群。作为生态构建者,四大事业群旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业群作为基石,将凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。

针对行业普遍关注的供应链安全问题,云天天励飞高级副总裁、CFO兼董秘邓浩然特别强调,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这将为公司后续芯片的大规模量产与交付提供极高的确定性。

来源:https://www.163.com/dy/article/KKSLS72M053469RG.html
上一篇清华团队首创“会适应的智能助手”,开启交互新篇章 下一篇云天励飞发布未来三年大算力芯片战略,加速AI推理竞赛
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。