云天励飞发布三年计划 加速大算力芯片战略布局
“我们正站在AI大规模应用落地的关键节点,迫切需要更高性价比的推理芯片来推动这一进程。”云天励飞董事长兼CEO陈宁强调道。
2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年在大算力AI推理芯片领域的战略布局。公司将核心研发资源集中于攻克大模型落地过程中的“成本壁垒”,通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标,从而推动AI技术从概念尝鲜走向普惠生产力。
加速布局推理算力
当前,全球算力产业的发展重心正加速向推理侧倾斜。
谷歌在发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理场景下系统化的能效优化至关重要。
与此同时,产业整合的步伐也在加快。知名企业与推理芯片初创公司Groq达成非独占许可合作,通过支付许可费的方式获得了其推理技术的授权,并吸纳其核心工程团队加入,以强化公司在推理与实时工作负载方面的能力。
云天励飞高管指出,推理侧的竞争已不再是单纯追求“把模型做得更强”的参数竞赛,而是转变为“让应用跑得更久、更稳、更便宜”的效能竞赛。单位推理成本与交付效率,已成为规模化落地的关键门槛。
“公司的目标是将百万Token的成本每年降低100倍。到2030年,我们要实现百亿Token成本仅为一分钱人民币,只有达到这个水平,才能真正称得上是一场工业革命。”陈宁表示。
架构创新
面对推理时代对系统级协同的更高要求,云天励飞确立了GPNPU技术路线,提出“GPNPU = GPGPU + NPU + 3D堆叠存储”的组合式架构。这一设计兼顾了通用计算的“广泛适用性”与NPU的“高效能特性”,旨在从工程层面系统性解决可迁移、可部署、可持续降本三大核心难题。
具体来看,在通用生态层面,云天励飞的GPNPU架构将兼容CUDA生态,实现一行代码完成CUDA程序兼容,大幅降低了用户进入生产系统的迁移门槛。
在推理能效层面,NPU能够实现更高的计算效率和能效比。面对大模型推理这类高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实的成本优势。这也是国际厂商持续加码专用路线的重要原因。
针对业界公认的“内存墙”瓶颈,云天励飞正深度研发3D堆叠存储及更前沿的互连技术,以提升带宽与能效,有效降低推理时延。
在架构工程与产品化路径上,云天励飞采取“算力积木”架构,即通过Chiplet扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力能够像搭积木一样按需扩展,形成从边缘到更大规模推理集群的弹性产品形态。同时,围绕真实业务负载持续迭代,逐一击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的综合最优解。
打造全场景算力矩阵
面向未来三年的规划,云天励飞CTO表示,将不遗余力地投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。
云天励飞的技术路线图将对标国际主流平台的代际演进,聚焦长上下文预填充、低时延解码等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。
陈宁在演讲中将公司核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。
去年,云天励飞进行了“1+4”架构调整:“1”指聚焦于AI大算力推理芯片,“4”则是四大事业群。作为生态构建者,四大事业群旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业群作为基石,凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。
针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO兼董秘特别强调,公司是目前国内少数手握充足国产产能保障的企业之一,这将为后续芯片的大规模量产与交付提供极高的确定性。
相关攻略
这项由印度萨蒂亚赛巴巴高等学习学院联合印度理工学院罗帕尔分校和红帽公司共同完成的研究发表于2026年3月的arXiv预印本平台,编号为arXiv:2603 17309v1。有兴趣深入了解的读者可以通
快科技3月27日消息,博主ETA Prime近日对苹果MacBook Neo进行了一项简单散热改造,仅靠一块铜片就让这款无风扇笔记本的游戏帧数翻倍,综合性能提升达18 6%。MacBook Neo搭
IT之家 3 月 17 日消息,科技媒体 Appleinsider 昨日(3 月 16 日)发布博文,报道称有网友在 Reddit 社区发帖,分享了低成本改造苹果 MacBook Neo 成果,将笔
IT之家 3 月 11 日消息,ARCTIC 昨日宣布推出面向工作站平台的 Liquid Freezer WS360 处理器 AIO 水冷散热器。该系列包含 AMD SP5、AMD SP6 和英特尔
IT之家 3 月 2 日消息,据彭博社记者马克 · 古尔曼(Mark Gurman)消息,苹果最快将于明年为 iPad Pro 配备均热板散热系统。IT之家注意到,古尔曼在其最新一期《Power O
热门专题
热门推荐
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练





