首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
云天数智发布AI芯片战略:大算力芯片未来三年规划

云天数智发布AI芯片战略:大算力芯片未来三年规划

热心网友
13
转载
2026-02-04

“我们正全面迈入AI应用大规模落地的关键时期,真正需要的是更高性价比的推理芯片。”云天天励飞董事长兼CEO陈宁这样强调。

2月3日,云天天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布了未来三年的大算力AI推理芯片战略布局。公司计划将核心研发资源集中于攻克大模型落地面临的“成本壁垒”,通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标,以此推动AI技术从“技术尝鲜”走向“普惠生产力”。

加速布局推理算力

当前,全球算力产业的发展风向正加速向推理侧倾斜。

谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,并强调其在大规模推理效能上的系统性优化。

与此同时,产业整合的步伐也在加快。2025年12月,英伟达与推理芯片企业Groq达成非独占许可安排,通过支付许可费的方式获得了Groq推理技术的授权,并吸纳其核心工程人才团队加入,以强化其在推理与实时工作负载方面的能力。

云天天励飞高管指出,推理侧的竞争已不再是单纯“把模型做得更强”的参数竞赛,而是转向“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。

“我们的目标是将百万TOKEN的成本每年降低100倍。到2030年,我们要实现百亿TOKEN成本仅一元人民币,只有到那时,才是一场真正的工业革命。”陈宁表示。

架构创新

面对推理时代对系统级协同的迫切需求,云天天励飞确立了GPNPU技术路线,并提出了“GPNPU=GPGPU+NPU+3D堆叠存储”的组合架构。这一设计旨在兼顾通用计算的“通用性”与NPU的“高效性”,从工程层面解决可迁移、可部署、可持续降本三大难题。

具体来看,在通用生态层面,云天天励飞的GPNPU架构将兼容CUDA架构,实现一行代码完成CUDA程序兼容,大幅降低了用户进入生产系统的门槛。

在推理能效层面,NPU能够实现更高的计算效率和能效比。面对大模型推理这种高度结构化、可被体系化优化的负载,专用设计带来的能效优势更容易转化为真实的成本优势,这也是国际厂商持续加码专用路线的重要原因。

针对业界公认的“内存墙”瓶颈,云天天励飞正深度研发3D堆叠存储及更前沿的互联技术,以显著提升带宽与能效,有效降低推理时延。

在架构工程与产品化路径上,云天天励飞采取“算力积木”架构。即通过Chiplet扩展与互联思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态;同时,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的综合最优解。

打造全场景算力矩阵

面向未来三年的规划,云天天励飞CTO李爱军表示,公司将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。

云天天励飞路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时解码码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。

陈宁在演讲中将公司核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。

去年,云天天励飞进行了“1+4”架构调整:“1”指聚焦于AI大算力推理芯片,“4”则是四大事业群。作为生态构建者,四大事业群旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业群作为基石,将凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。

针对行业普遍关注的供应链安全问题,云天天励飞高级副总裁、CFO兼董秘邓浩然特别强调,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这将为公司后续芯片的大规模量产与交付提供极高的确定性。

来源:https://www.163.com/dy/article/KKSLS72M053469RG.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

HPE发布64TB内存服务器 专为内存数据库优化
科技数码
HPE发布64TB内存服务器 专为内存数据库优化

HPE(慧与)近日重磅发布了业界首款64TB内存服务器——HPE Compute Scale-up Server 3250。这款产品精准定位于大型内存数据库与实时分析场景,致力于应对那些对内存容量、数据吞吐速度及延迟有严苛要求的核心关键业务负载。 简而言之,这是一款专为海量数据即时运算与实时处理设计

热心网友
05.16
HPE发布64TB内存服务器,专为内存数据库优化设计
科技数码
HPE发布64TB内存服务器,专为内存数据库优化设计

5月12日,HPE(慧与)在美国正式发布了业界首款配备64TB超大内存的服务器——HPE Compute Scale-up Server 3250。这款产品精准定位于大型内存数据库、实时分析等对内存容量有极致需求的关键应用场景,旨在高效处理企业中最核心、最复杂的业务工作负载。 值得关注的是,这是HP

热心网友
05.16
印度院校实现智能内存控制器,优化系统卡顿与功耗表现
科技数码
印度院校实现智能内存控制器,优化系统卡顿与功耗表现

这项由印度萨蒂亚赛巴巴高等学习学院联合印度理工学院罗帕尔分校和红帽公司共同完成的研究发表于2026年3月的arXiv预印本平台,编号为arXiv:2603 17309v1。有兴趣深入了解的读者可以通

热心网友
03.31
MacBook Neo散热有硬伤?加装铜片游戏性能翻倍实测
娱乐
MacBook Neo散热有硬伤?加装铜片游戏性能翻倍实测

快科技3月27日消息,博主ETA Prime近日对苹果MacBook Neo进行了一项简单散热改造,仅靠一块铜片就让这款无风扇笔记本的游戏帧数翻倍,综合性能提升达18 6%。MacBook Neo搭

热心网友
03.27
MacBook超频改造实战:2.3GHz稳超3.3GHz性能提升指南
娱乐
MacBook超频改造实战:2.3GHz稳超3.3GHz性能提升指南

IT之家 3 月 17 日消息,科技媒体 Appleinsider 昨日(3 月 16 日)发布博文,报道称有网友在 Reddit 社区发帖,分享了低成本改造苹果 MacBook Neo 成果,将笔

热心网友
03.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

英特尔Titan Lake处理器全系支持LPDDR6内存
业界动态
英特尔Titan Lake处理器全系支持LPDDR6内存

英特尔下一代TitanLake处理器全系支持LPDDR6内存。面向主流笔记本的U、P及高能效PX系列还将兼容LPDDR5X与DDR5,为设备设计提供灵活性。U、P、PX系列采用Intel18A工艺的新CPU模块,而B、BX系列沿用旧架构。高端PX系列集成GPU采用台积电N2P工艺,配备16个Xe核心,旨在提升图形性能。

热心网友
05.23
比特币巨鲸4.96亿美元空单引发市场对去中心化公信的深度讨论
web3.0
比特币巨鲸4.96亿美元空单引发市场对去中心化公信的深度讨论

一只鲸鱼做空比特币 4 96 亿美元,触发市场公信讨论 最近,链上数据捕捉到的一笔大额交易,瞬间吸引了所有市场参与者的目光:一只比特币巨鲸,悄然开立了价值近5亿美元的空单。这笔操作如同一块投入平静湖面的巨石,不仅激起了短线的价格波澜,更将市场深层的公信机制与交易透明度问题,再次推到了讨论的中心。 鲸

热心网友
05.23
四海兄弟故乡成就快速达成攻略
游戏攻略
四海兄弟故乡成就快速达成攻略

解锁《四海兄弟》“故乡没那么快”成就需耐心探索:深入隐秘角落,留意环境细节;积极与居民互动,收集对话线索;完成相关支线任务,关注伏笔;并注意特定时段触发的事件。成就进度可累积,坚持全面探索方能最终达成。

热心网友
05.23
鬼谷子最强出装推荐与实战打法攻略
游戏攻略
鬼谷子最强出装推荐与实战打法攻略

鬼谷子是战术型辅助,核心在于技能运用与合理出装。二技能是关键控制,配合大招的群体伪装可发起突袭。出装以冷却缩减和生存能力为主,如冷静之靴、极寒风暴和魔女斗篷。实战中需把握进场时机,从侧翼切入控制敌方核心,并注意与队友配合衔接伤害。

热心网友
05.23
AI音效生成工具OptimizerAI自动为视频添加背景音乐
AI教程
AI音效生成工具OptimizerAI自动为视频添加背景音乐

在游戏开发、动画制作、视频创作等数字内容领域,专业音效设计是提升作品沉浸感与专业度的关键。然而,传统音效制作流程往往依赖昂贵的专业设备与庞大的素材库,对独立开发者、小型团队及个人创作者构成了较高的技术门槛与成本压力。近期,一款名为OptimizerAI的人工智能音效生成平台备受关注,它致力于通过AI

热心网友
05.23