云天励飞发布未来三年大算力芯片战略,加速AI推理竞赛
“我们正全面进入AI应用大规模落地的关键阶段,急需更高性价比的推理芯片支撑这一进程。”云天励飞董事长兼CEO陈宁在战略前瞻会上强调。
自今年2月3日起,公司正式对外公布了未来三年的大算力AI推理芯片核心战略布局。该战略将研发资源集中于攻克大模型落地过程中面临的“成本壁垒”,致力于通过底层架构的系列创新,显著降低大规模推理成本,目标是将百万tokens的推理成本降低百倍以上,从而推动人工智能从技术尝鲜走向普惠生产力。
加速布局推理算力
当前,全球算力产业的发展重心正快速向推理侧倾斜。
谷歌在发布第七代TPU“Ironwood”时,明确了其面向推理场景的战略定位,并强调需在大规模推理效能上进行系统性优化。与此同时,产业整合也在加速进行。去年末,英伟达与推理芯片新锐Groq达成合作,通过非独占许可安排,获得了其核心推理技术的授权与工程人才团队的加持,此举显著强化了其在高性能推理与实时工作负载方面的能力。
云天励飞高层指出,推理侧的竞争已不再仅仅是模型参数规模的比拼,更是关乎“让应用跑得更久、更稳、更经济”的效能竞赛。单位推理成本与交付效率已成为衡量技术能否规模化落地的最大门槛。
“公司的目标是将百万token的推理成本每年降低百倍。展望2030年,我们希望实现百亿token一分钱的成本水平。只有达到这个里程碑,才算得上是一场真正的工业革命。”陈宁如是阐述公司的长远愿景。
架构创新
为满足推理时代对系统级协同的严苛需求,云天励飞确立了名为GPNPU的技术路线。这一创新架构融合了GPGPU的通用性和NPU的高效能,同时前瞻性地集成了3D堆叠存储技术,旨在从工程层面系统性地解决可迁移、可部署、可持续降本三大核心挑战。
具体而言,在通用生态层面,云天励飞的GPNPU架构将保持与行业主流框架CUDA的兼容,实现代码级无缝迁移,从而降低用户将其应用部署到生产系统的门槛。
而在推理效能层面,专用NPU架构能够实现更高的计算效率和能效比。针对大模型推理这类高度结构化、可被体系化优化的负载,专业化设计带来的效能优势更容易转化为真实的成本优势。这也是国际领先厂商持续投入专用路线的重要原因。
针对业界公认的“内存墙”瓶颈,云天励飞正深入研发3D堆叠存储及更前沿的互连技术,旨在大幅提升内存带宽与能效,有效降低推理时延。
在架构工程与产品化路径上,公司采取“算力积木”的构建思路:通过Chiplet扩展与互连设计,将标准计算单元进行模块化封装与灵活组合,使得算力能够像搭积木一样按需扩展,形成从边缘到云端大规模推理的弹性产品形态。同时,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制、可交付的综合最优解。
打造全场景算力矩阵
面向未来三年的规划,云天励飞CTO李爱军表示,公司将不遗余力地投入大算力芯片DeepVerse的研发,围绕成本、时延与吞吐等核心性能指标持续迭代,并按照产品节奏梯次覆盖市场需求。
公司的路线图将对标国际主流平台的代际演进,聚焦于长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统级优化,力求在真实负载下持续兑现“更经济、更稳定、更易部署”的产品承诺。
陈宁将公司的核心竞争力总结为技术、产能、生态、市场、资本五大关键要素的协同共振。这不仅构成了云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。
回顾去年,公司进行了“1+4”架构的重要调整:“1”代表聚焦于AI大算力推理芯片这一核心,“4”则是支撑核心的四大事业部。作为生态构建者,四大事业部旨在系统解决芯片从“研发生产、优化打磨到市场推广”全链条中的核心难题。其中,政企事业部作为基石,凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。
针对行业普遍关注的供应链安全问题,公司高级副总裁、CFO兼董秘邓浩然特别强调,公司是国内少数拥有充足国产产能保障的企业之一。这为公司后续芯片的大规模量产与稳定交付提供了极高的确定性。
相关攻略
HPE(慧与)近日重磅发布了业界首款64TB内存服务器——HPE Compute Scale-up Server 3250。这款产品精准定位于大型内存数据库与实时分析场景,致力于应对那些对内存容量、数据吞吐速度及延迟有严苛要求的核心关键业务负载。 简而言之,这是一款专为海量数据即时运算与实时处理设计
5月12日,HPE(慧与)在美国正式发布了业界首款配备64TB超大内存的服务器——HPE Compute Scale-up Server 3250。这款产品精准定位于大型内存数据库、实时分析等对内存容量有极致需求的关键应用场景,旨在高效处理企业中最核心、最复杂的业务工作负载。 值得关注的是,这是HP
这项由印度萨蒂亚赛巴巴高等学习学院联合印度理工学院罗帕尔分校和红帽公司共同完成的研究发表于2026年3月的arXiv预印本平台,编号为arXiv:2603 17309v1。有兴趣深入了解的读者可以通
快科技3月27日消息,博主ETA Prime近日对苹果MacBook Neo进行了一项简单散热改造,仅靠一块铜片就让这款无风扇笔记本的游戏帧数翻倍,综合性能提升达18 6%。MacBook Neo搭
IT之家 3 月 17 日消息,科技媒体 Appleinsider 昨日(3 月 16 日)发布博文,报道称有网友在 Reddit 社区发帖,分享了低成本改造苹果 MacBook Neo 成果,将笔
热门专题
热门推荐
在《燕云十六声》中领悟“菩提苦海”,需沉浸探索游戏世界。主线剧情构建认知框架,战斗观察、场景细节与NPC对话皆暗藏线索。通过多元视角拼凑因果,方能深入理解游戏蕴含的宏大叙事与深邃魅力。
2026年618大促的序幕刚刚拉开,初期战报已经透露出一些耐人寻味的信号。截至5月21日,海信电视在京东平板电视累计销售竞速榜上拔得头筹,其RGB-Mini LED爆款王——海信小墨E5S Pro,更是同时拿下了天猫平板电视和抖音大家电的5 20单品销冠。 这并非偶然。奥维云网的全渠道监测数据给出了
充电桩领域的“军备竞赛”再次迎来重磅升级。5月22日,极氪汽车正式发布了其全新一代液冷超级充电桩,将单枪峰值功率一举提升至行业领先的800kW,标志着超充技术迈入新阶段。 根据官方披露的核心信息,这款超充桩主要具备四大优势:极速补能、高效节能、广泛适配与多重安全。具体而言,其单枪峰值电流高达800A
获取电弧机剑主要有五种途径:推进主线任务以解锁线索;探索遗迹、工厂等特定区域;挑战特定副本与Boss;完成提及传说武器或遗物的支线任务;参与限时活动并达成要求。玩家可根据偏好选择或组合多种方式获取该武器。
小米汽车再次为潜在车主带来惊喜福利!即日起至5月31日,用户只需提前完成预约,并到店参与任意车型的试驾体验,即可免费获赠一款1:64精致合金车模。车模款式与颜色随机发放,为试驾过程增添一份专属的收藏乐趣,诚意十足。 参与本次活动需注意以下细则:试驾必须通过官方渠道提前预约;各授权门店的车模备货数量不





