异构计算如何成为未来AI算力基础设施的关键方向
2026年,AI产业正步入一个全新的高强度算力周期。
随着智能体(Agentic AI)、代码助手、智能办公等应用加速从概念走向落地,AI正越来越多地处理真实世界的复杂任务。随之而来的,是“Token”这一概念,正迅速成为衡量AI资源消耗的核心单位。
于是,一个关键问题浮出水面:现有的算力体系,能否支撑起未来更高频、更复杂的AI应用场景?这直接关系到产业下一阶段的增长动能。正如太初元碁首席产品官、高级副总裁洪源在量子位AIGC2026峰会上所指出的,在Token经济加速到来的背景下,AI算力需要向上更好地兼容框架、模型与应用,为大模型的训练、推理乃至最终的行业落地,提供更稳定、高效且易用的基础支撑。同时,大模型能力的跃迁与AI应用的激增,正在持续释放海量的Token调用需求,这无疑为国产算力带来了全新的发展窗口。
这意味着,未来的算力将不再仅仅是隐藏在模型训练背后的“默默付出者”。它将贯穿从模型研发、应用部署到具体行业场景落地的全链路,成为Token智能时代最关键的新型基础设施。

以下是洪源演讲的核心观点与全文,经整理后呈现,以期带来更多产业层面的思考。
核心观点梳理
随着智能体、行业大模型和各类智能应用深入真实业务场景,AI计算的核心正在从“生成内容”转向“生成任务”。这一转变,对底层算力系统的稳定性、效率及协同能力提出了前所未有的高要求。未来的挑战,在于解决多种计算单元(如CPU、GPU)之间的高效配合、协同调度,并大幅降低其间的等待与通信成本。
对国产AI算力而言,这无疑是新的机遇,但真正的突破点已不止于单点性能的比拼,更在于大规模集群的服务能力、整体计算效率以及生态的易用性。当大模型训练与推理迈向万卡乃至更大规模集群时,算力厂商必须从硬件、互联、软件、调度到运维,进行全链条的能力提升。
特别值得注意的是,在一个智能体任务执行过程中,GPU用于纯计算的时间可能仅占一小部分,大量时间消耗在CPU调度、通信、数据处理等环节。因此,异构计算能力将成为未来AI算力基础设施的重要演进方向。未来的AI算力,将如同Token经济中的“制氧机”,持续为模型、应用和行业场景的运行提供不可或缺的支撑。
Token经济加速到来,国产AI算力迎来新机遇
自2024年底ChatGPT掀起浪潮以来,大模型行业的迭代速度便不断刷新认知。尤其是进入今年,主流模型的更新频率更是有增无减。
对于算力厂商而言,这意味着必须持续围绕主流大模型进行适配与优化。无论是模型的数量、训练数据的规模,还是所需的算力总量与模型自身的参数规模,都呈现出极为显著的增长曲线。
在此背景下,“Token经济”成为今年行业讨论的高频词。随着大语言模型调用量的激增,Token正迅速确立其作为AI时代核心消耗单位的地位。国产模型相关的调用量,也在这一浪潮中持续攀升。
从OpenRouter等机构的预测数据来看,从2025年到2026年,再到2030年,全球Token调用总量预计将出现指数级增长,增幅可能高达212倍。可以预见,无论是面向消费者的应用,还是企业级的行业解决方案,都将带来规模空前的Token消耗。

伴随着Token调用的快速增加,AI应用市场本身也在飞速扩张。越来越多的应用开始走出演示(Demo),进入真实的业务场景。办公、编程、医疗、教育、能源、电力等行业,都在加速引入并整合AI能力。
这一切都指向一个结论:底层的算力基础设施,必须能够支撑未来更高频、更复杂、更大规模的AI调用需求。有趣的是,算力效率的提升并不会减少需求,反而会进一步释放它——生产效率提高后,应用场景会增多,调用频次会增高,最终带来的是对算力需求的持续增长。
根据IDC及国内多家调研机构的预测,到2030年,全球算力规模预计将以每年约60%的速度增长,而其中90%以上都将是智能算力。对于国产AI算力来说,这无疑是一轮至关重要的战略机遇。大模型能力的持续增强、Token需求的快速释放、行业应用的加速落地,三者共同构成了推动国产算力走向更广阔产业天地的核心动力。
大模型进入任务时代,AI算力需要解决三大关键问题
当然,机遇总是与挑战并存。面对新的产业图景,国产AI算力需要攻克几个关键的系统性问题。
首要问题,是大规模集群的服务能力。
当前,大模型的训练与推理对集群规模的要求越来越高,动辄需要万卡乃至更大规模的系统。在这种超大规模集群中,如何保证训练效率、系统稳定性、成本可控性与整体可靠性,是算力企业必须交出答卷的必答题。

第二个核心问题,是计算效率,尤其是异构协同效率。
当智能体(Agent)执行一个用户任务时,流程涉及任务规划、工具调用、多轮执行与结果反馈。在这个过程中,一个经常被忽略的事实是:GPU真正用于数值计算的时间,可能只占整个任务执行周期的10%左右。大量的时间,实际上消耗在了CPU调度、不同组件间的通信、数据准备与搬运等环节。
CPU更擅长串行计算与复杂调度,GPU则专精于并行计算。未来的AI算力系统,必须更好地统筹调度这些不同的计算单元,让整个任务执行链路像精密的齿轮一样高效咬合,减少空转与等待。

第三个问题,是生态壁垒。
对于国产算力企业而言,芯片设计成功只是万&里长征的第一步。真正决定用户能否用起来、开发者是否愿意用、现有模型与应用能否平滑迁移的关键,在于芯片之上的软件栈与生态系统。
国产算力要想真正服务好蓬勃发展的Token经济,就必须为开发者和行业客户提供更好用、更易用的生态工具。无论是底层的框架开发者,还是上层的模型厂商、应用厂商,都需要能够顺畅地完成模型的迁移、训练、微调和最终部署。
总而言之,AI算力的发展早已过了单纯“堆性能、堆算力”的阶段。尤其在智能体快速发展的背景下,AI计算正从“生成内容”走向“生成任务”。这对算力系统提出了全新的要求:未来必须系统性地解决异构协同、高效可用与生态适配等一系列复杂问题。当计算单元需要紧密配合以完成复杂任务时,如何降低其间的等待与通信成本,将成为衡量算力基础设施先进性的重要标尺。
从超算积累到生态适配,打造AI产业「制氧机」
面对上述挑战,行业已在积极进行探索与实践。以太初元碁为例,其路径体现了从底层硬件到上层生态的系统性思考。
首先,在应对大规模集群挑战方面,其团队在高性能计算(HPC)领域拥有长期的技术积累。以往面对动辄十万核乃至数十万核级别的超算任务所积累的大规模并行计算与协同经验,为今天构建高效的AI算力集群提供了宝贵的基础。
其次,在异构计算架构上,需要从芯片设计之初就进行布局。例如,在核心芯片设计中集成面向通用计算、数据处理以及并行计算等不同功能的核心模块,并通过高效的片上网络进行互联。这类架构设计的初衷,正是为了适应未来AI任务日益复杂的趋势——任务不再是一次性的模型推理,而是包含任务拆解、工具调用、数据处理、多轮交互的完整链路。底层算力系统必须具备强大的内部协同能力,才能高效支撑这样的任务流。
此外,生态建设被视为不可或缺的一环。在底层,提供自研的编程框架和语言支持是基础,同时兼容主流开发范式(如Python)以降低开发者门槛也至关重要。更进一步,探索基于自然语言的自动算子生成能力,能帮助用户进一步降低开发成本。围绕模型训练、微调、推理部署的全流程,提供一体化解决方案,并与主流第三方框架、模型库广泛适配,才能帮助模型厂商和应用厂商更顺畅地迁移和使用国产算力。
洪源用了一个形象的比喻:Token经济全面到来后,算力对于整个AI产业,就如同氧气之于人类生命,是不可或缺的基础资源。而业界正在努力构建的新型算力基础设施,目标就是成为产业持续发展的“制氧机”。其核心使命,是与产业伙伴协同,整合上下游资源,共同为中国AI产业提供稳定、高效且自主可控的算力基石。
相关攻略
谈到AI芯片,多数人首先想到的往往是GPU、先进制程这些备受瞩目的技术。然而,很少有人注意到,真正制约全球算力发展的关键,可能是一座低调却至关重要的“隐形桥梁”——ABF基板。 更令人惊讶的是,掌控这一核心环节的,竟是一家以调味品著称的日本公司。随着台积电在封装技术上的突破、英伟达对供应链的提前部署
三大运营商推出AI算力Token包月套餐,将大模型处理单元像手机流量一样打包销售,支持话费支付且跨平台通用。套餐最低9 9元,面向个人、开发者和企业,最高每月含1 5亿Token。此举打破了大厂对算力的垄断,推动运营商从“流量管道商”向“算力服务商”转型,以低门槛激活广泛的AI应用市场。
5月11日,领益智造(股票代码:002600 SZ)正式宣布,其旗下子公司赛尔康(Salcomp)成功研发的AIDC算力电源CRPS 1300W产品,已于近日完成首批规模化量产,并顺利交付给核心客户。此次成功交付,标志着领益智造在AI服务器电源这一关键领域,不仅掌握了核心技术,更已形成稳定可靠的批量
英伟达首席执行官黄仁勋的基金会以1 08亿美元从AI云服务商CoreWeave采购算力资源,并全部捐赠给大学及非营利研究机构,以支持前沿科研。英伟达还将为部分受赠方提供免费技术支持。此举进一步凸显了英伟达在构建AI研究生态方面的深度布局。CoreWeave是英伟达的重要合作伙伴,其业务高度依赖英伟达硬件。
在AI需求爆发的背景下,GPU市场出现供需严重失衡。英伟达CEO黄仁勋将旧款GPU价格持续上涨的现象比喻为“好酒效应”,指出其升值速度甚至超过葡萄酒陈化。核心原因在于全球AI业务对算力的巨大需求,使得数据中心极度依赖GPU。这种需求从上游芯片制造到下游云服务贯穿整个产业链,导致包括四五年前旧型号在内
热门专题
热门推荐
在《零号任务》的精彩冒险中,清晰掌握个人资产状况是提升游戏水平、优化决策效率的核心基础。无论是筹备大型采购,还是制定下一步的战术策略,对自己的游戏财富了如指掌都至关重要。本文将为您详细解析如何在游戏中快速查看并有效管理您的全部资产。 查看资产的操作流程非常简便。首先,您需要正常登录并进入游戏主界面。
在《和平精英》演唱会模式中,荧光棒具备攻击与救援双重功能。攻击可干扰对手视觉与状态,但不会造成实质伤害;救援则可敲击解除被冰封队友的冻结状态,帮助其恢复行动。这一道具是影响团队胜负的重要协作工具。
苏莱曼从DeepMind联合创始人到加入微软后,其负责的AI项目进展缓慢,未能兑现AI快速取代专业工作的预言,导致业界评价走低。其技术能力与管理风格均受质疑,从早期共创辉煌到如今因项目迟滞沦为笑谈,其经历凸显了在激烈竞争中持续交付成果的重要性。
《灵域修仙之神王传说》构建了一个灵气充盈的仙侠世界,玩家作为修行者需通过探索、修炼掌握天地法则。游戏包含丰富的门派选择、技能体系与炼丹制器等深度玩法,并融入神兽、社交及奇遇系统,结合精美画面与战斗体验,提供高自由度的沉浸式修仙之旅。
ASML首席执行官警告,欧洲人工智能法案需改革或废除,避免“简单化”规则限制技术供应链。该法案严格监管,但可能因理想化规则抬高成本、拖累创新,威胁全球半导体供应链稳定。产业界呼吁政策需平衡安全与开放、监管与创新,避免过度规制束缚欧洲科技竞争力。法案走向将影响全球科技格局。





