ATaaS平台发布:如何构建日产能万亿的Token工厂
3月27日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。论坛汇聚院士、顶尖学者及产业领军人物,聚焦大模型时代推理服务的核心技术、产业实践和生态协同,共探高效、稳定、安全、普惠的大模型推理服务体系建设。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

活动特邀九源智能计算生态联合体秘书长、清华大学教授、趋境科技首席科学家武永卫担任主持人。启元实验室副主任刘航、工业和信息化部电子工业标准化研究院副院长郭楠为活动致辞。中国工程院院士、九源智能计算系统生态联合体理事长、清华大学教授、趋境科技首席科学顾问郑纬民受邀出席并做主旨演讲,从宏观视角解读了从“模型服务”迈向“Token服务”的底层逻辑与基础设施变革。趋境科技创始人兼CEO艾智远现场发布全新一代AI推理平台——趋境 ATaaS 高效能 AI Token 生产服务平台(Approaching.AI Token as a Service),为破解算力投入与Token产出失衡难题提供了系统性解决方案。众多等产业链领军企业代表现场带来主旨演讲,分享AI推理服务产业的发展新路径。
郑纬民院士:AI产业核心已从模型服务转向Token服务
郑纬民院士在题为《从模型服务到Token服务》的主旨演讲中指出,随着智能体、AI Coding等应用的爆发式增长,Token消耗量呈百倍、千倍级跃升,2026年已成为名副其实的“Token爆发元年”。AI产业的核心关注焦点,正从“模型参数规模、模型可用性”全面转向“稳定、低成本、高质量交付的Token产能”。

“未来的智能基础设施应围绕‘Token即服务(TaaS,Token as a Service)’进行重构”。郑纬民院士表示,传统模型服务的核心是保障模型可得性与接口完整性,而Token服务的核心是保障Token产能的可用性,更关注成本、吞吐、延迟与可靠性等生产性指标,是一个极端复杂的多维系统最优化问题,必须完成全链路的系统级创新。
对此,郑纬民院士明确了TaaS发展的三大核心技术底座:一是全系统异构协同,通过将不同计算任务合理分配至GPU、CPU、内存和SSD,打破算力瓶颈;二是存算协同实现“以存换算”,通过前置KV Cache等技术,大幅降低重复计算量,提升推理效率;三是面向SLO的智能调度,精准地将用户业务需求“翻译”为底层资源决策。郑院士表示:“只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造Token为王的普惠智能时代。”
趋境ATaaS平台重磅发布,打造全球领先的Token生产效能放大器
趋境科技在论坛上重磅发布了其核心产品——趋境ATaaS高效能AI Token生产服务平台。本次发布由趋境科技创始人兼CEO艾智远,与中国工程院院士、九源智能计算生态联合体理事长、清华大学教授、趋境科技首席科学家郑纬民,以及并行科技董事长陈健、中科曙光智能计算产品事业部总经理杜夏威、华为昇腾计算业务副总裁兼首席产品规划师叶耀荣、京东Infra产品负责人郝鹏、浦江实验室代表钟普共同揭晓。

针对当前大模型推理服务中普遍存在的硬件资源闲置、软件适配滞后、算力配置粗放、架构演进失衡四大核心难题,该平台将有效破解大额硬件投入难以转化为优质 Token 产能、资源浪费与成本空耗突出的行业困境,以高效能Token生产为核心目标,可支撑万级别AI推理需求,并达到日均万亿级别Token整体产能。
趋境ATaaS平台依托四大自研核心技术,构建覆盖异构整合、智能调度、弹性扩容的全链路能力:
·六合:异构推理2.0:全球首创大模型计算逻辑重构技术,深度融合CPU+GPU、国产与非国产算力,实现任务的智能分流,可将万卡级智算集群运营成本压降20%以上。
·月饼:以存换算2.0:全球首创超体量KV Cache缓存技术,将KV Cache存储空间扩展百倍至千倍,缓存命中率最高可达90%,直接削减90%的GPU算力开销。
·双仪:虚实同构:全球首创算子级SLO仿真技术,实现算力资源的智能预规划与动态调优,可精准切分异构算力,将万卡级智算集群硬件综合资源利用率最高提升数倍。
·万象:极致弹性:打通规模化量产最后壁垒,支持万亿参数大模型7秒快速拉起与动态配置变更、数百节点超大规模EP弹性调度,为万卡级高性能横向扩展提供关键能力。
趋境ATaaS平台的发布为AI基础设施的建设和运营提供了新的思路和行业标准,使每单位算力和能耗投入都能够数倍转化为更稳定、更可衡量的Token价值产出,更标志着AI基础设施发展焦点从单纯的算力规模竞争,转向对 Token 生产效率的综合衡量,推动算力基础设施从“数据中心”向“Token工厂”全面演进。

全产业链生态协同,凝聚国产算力发展核心共识
本次论坛不仅是技术的展示台,更是产业生态协同的汇聚点。趋境科技积极推动与产业链上下游伙伴的深度合作,致力于构建开放共赢的智能计算生态。论坛上,来自并行科技、九源智能计算系统生态联合体、中科曙光、京东云、阿里云、华为、商汤科技等企业的代表在论坛上围绕国产算力多场景推理优化实践、推理框架实践、Token时代AI引擎、算力底座高效推理等前沿话题以及与趋境科技的深度合作展开深入分享。
并行科技作为国内领先的算力服务商,在第三方算力服务领域位列第一,并行科技董事长陈健在演讲中指出,其MaaS服务得到趋境科技的大力支持,双方合作将高质量Token的生产成本大幅优化,并将特定场景下的集群性能提升50%,共同为智谱、Kimi、MiniMax、DeepSeek等头部大模型客户提供优质服务。
九源智能计算系统生态联合体副秘书长王豪杰指出,Token时代竞争转向单位成本产出,国产卡面临“生态驱动”困局。九源联合体打造国产智能计算生态,已取得多项成果:全国产化方案适配多款GPU、串行代码高效并行的九源领域编程语言“九齿”、支撑Mooncake推理加速系统、基于国产芯片的高效智能体,并与KTransformers等框架深度联动,推动国产算力从“可用”迈向“好用”。
京东云AI Infra产品负责人郝鹏表示,京东云已与趋境科技达成深度合作,联合打造下一代推理引擎,共同赋能Mooncake开源生态。华为昇腾计算业务副总裁、首席产品规划师叶耀荣强调,趋境与昇腾展开了全方位的技术和商业化合作,部分项目中在昇腾AI集群上实现了2倍以上性能提升。此外,阿里云政企事业部教育科研解决方案总监杨坤、商汤科技大装置首席架构师项铁尧等也分享了与趋境科技在Mooncake等开源项目上深度合作,以及为趋境Token服务提供高可靠算力支持的实践。
在圆桌对话环节,清华大学计算机系副教授章明星与中国移动数智化部副总经理陈国,天数智芯副总裁宋煜,中国科学技术大学计算机学院特任教授、博导李诚,美团首席工程师钱玉磊,趋境科技Mooncake首席工程师杨珂,围绕“国产推理基础设施从‘可用’到‘好用’的路线选择与关键突破”展开探讨。各方凝聚了三大共识:一是软硬深度协同是释放国产算力潜能的关键,需通过系统级优化弥合硬件性能与业务需求之间的鸿沟;二是生态统一与标准建设至关重要,打破“百花齐放”带来的适配难题,才能实现规模化应用;三是人才培养是产业根基,需通过开源社区、技术竞赛等方式,培育兼具理论与工程能力的AI Infra人才。

本次研讨会的成功举办,恰逢AI产业从模型竞争转向规模化应用、从MaaS转向TaaS的关键节点,不仅为AI推理服务领域搭建了产学研用深度交流的平台,更为AI产业高质量发展谋划路径。论坛同期宣布2026年春季启元人工智能大赛正式启动,旨在通过赛教融合,为国产智能计算生态培育新一代人才,持续推动AI产业的开源创新与规模化应用。
转载来源:趋境科技
相关攻略
算力租赁市场持续升温,行业格局悄然生变 4月15日,资本市场上的算力租赁板块表现相当活跃,反复走强。午后,协创数据(300857 SZ)、宏景科技(301396 SZ)的股价涨幅超过了10%,利通电子(603629 SH)更是逼近涨停板,股价续创历史新高。与此同时,恒润股份(603985 SH)、亿
OpenAI内部备忘录曝光:直指竞争对手Anthropic算力规模“不在一个量级” AI领域的竞争,火药味越来越浓了。就在本周,OpenAI向投资者发送的一份内部备忘录被曝光,内容直指其主要竞争对手Anthropic。OpenAI在文件中毫不客气地指出,双方的“规模体量完全不在一个量级”,并称Ant
高端GPU缺货、存储价格上涨、AI项目交付延迟。过去几个月,算力供给的收紧,正在从上游快速传导至整个IT产业链。多位渠道商近日对第一财经记者表示,AI算力需求的爆发已明显拉长关键设备的交付周期。“高
走进上海智能算力科技有限公司(下称“智算科技”)位于上海松江区的国产万卡集群智算中心,刚踏入机房大门,浑厚而持续的风扇轰鸣声便扑面而来。目光所及,数万张GPU在机柜里整齐排列、鳞次栉比;高速网络线缆
算力是人工智能的底座,而算力集群好比AI世界的“发电机”,其高效调度与稳定运维,直接决定了大模型等产业的发展速度。在上海仪电,一支平均年龄仅32岁的智算科技万卡集群青年突击队,从零起步、边干边学,不
热门专题
热门推荐
以太坊网络交易活跃度是衡量其生态健康与市场流动性的关键指标。本文分析了影响ETH成交活跃度的核心因素,包括网络性能、Gas费用及用户行为。通过梳理当前主流交易平台的特点,展望了至2026年可能影响排名的技术趋势与市场格局,为参与者提供长期观察视角与决策参考。
欧易OKX是全球知名数字资产交易平台,提供现货、合约等多种交易模式及理财服务。用户可通过官方网站或官方应用商店下载正版App,确保访问安全。注册需完成手机或邮箱验证及身份认证。平台功能包括多元交易、专业行情工具、多重安全验证及跨平台数据同步,保障用户资产安全与操作便捷。
选择可靠平台是加密货币投资的关键。币安交易量领先,OKX衍生品突出,Gate io资产丰富。火币在亚洲市场稳定,Coinbase以合规安全著称。Bybit专注衍生品,Bitget提供复制交易功能。KuCoin资产种类多,Kraken安全体系完善,MEXC支持资产超2000种。各平台特色不同,需根据自身需求综合选择。
本文从BTC现货深度这一核心指标出发,探讨其对衡量交易平台综合实力的重要性。通过分析深度数据的构成与意义,并结合市场流动性、用户信任与平台生态等维度,对2026年主流数字资产交易所的潜在格局进行展望。深度不仅是交易体验的保障,更是平台技术、风控与长期运营能力的集中体现,是投资者选择平台时不可忽视的关键参考。
火币HTX全球站提供官方网址入口及安卓与iOS客户端安装指引。安卓用户需从官网下载安装包,并在系统设置中允许安装。iOS用户可直接通过AppStore下载安装。应用安装后需注册账户并完成邮箱验证,之后即可登录进行数字货币交易。





