中国移动MoMA模型平台正式上线
2026年5月8日,在移动云大会主论坛上,中国移动正式发布其一站式移动模型服务平台——MoMA。此次发布不仅是推出一款新的AI工具,更标志着AI服务模式的一次重要升级。该平台已集成超过300个业界主流AI模型,在模型丰富性与多样性上处于行业前列。尤为引人注目的是,平台创新性地采用了Token集约化运营模式,其核心愿景是让AI能力如同水电般基础便利,实现“随时可得、随处可用”,从而加速人工智能技术普惠化,赋能千行百业数字化转型。

开放与普惠:降低AI应用门槛
MoMA平台的设计核心理念是构建一个“一次接入、智能优选、普惠可用、安全可信”的模型服务生态。其根本目标是显著降低人工智能技术的使用门槛,让广大企业与开发者能够更便捷、更经济地获取和调用AI能力。
如何实现这一目标?首先,平台提供了统一的API网关。用户仅需完成一次接入,即可调用平台上集成的所有模型资源。目前,资源池已涵盖中国移动自研的“九天”系列大模型,以及DeepSeek、通义千问、豆包、Kimi、GLM等市场主流优质模型。这些模型覆盖文本生成、代码编写、语音识别、多模态理解等多种任务,能够充分满足政务、金融、工业、医疗、教育等复杂场景的智能化需求。
面对众多模型选项,用户如何高效选择?MoMA平台首创了智能路由引擎。该引擎可自动解析用户请求,并支持用户根据业务目标设定“成本优先”、“效果优先”或“均衡优先”等策略,从而动态匹配并推荐最优模型。该智能调度能力同样体现在服务高可用保障上:当主选模型出现响应超时、流量限制或服务异常时,系统能在秒级内自动切换至备用模型,确保用户业务连续稳定运行。
成本控制是企业关注的重点。MoMA平台基于国产算力部署了自研的高效推理引擎,结合智能路由对长尾模型资源的灵活调度,实现了单位Token处理成本降低约30%,同时资源利用率提升超过50%。此外,通过智能缓存、上下文复用、Token压缩等多项技术的综合运用,进一步优化了整体使用成本。平台秉持的中立路由原则,旨在帮助用户在模型效果与算力开销之间找到最佳平衡点。
安全与可信是普惠服务的基石。针对政务、金融等高敏感数据场景,MoMA特别提供“机密模型”服务。该服务将模型部署于硬件级加密的机密计算容器中,通过可信执行环境(TEE)等技术实现计算过程的数据安全隔离,确保业务数据“可用不可见”,为高安全等级需求提供全链路可靠保障。
集约化运营:实现Token高效管理与优化
如果说“开放普惠”解决了AI“用得起、用得上”的问题,那么“集约化运营”则致力于实现“用得好、管得住”的精细化目标。MoMA围绕Token的使用全生命周期,构建了涵盖精准计量、风险管控与经营分析的完整运营体系,旨在推动算力资源实现规范化、可追溯、高效率的集约利用。
在计费模式上,平台实现了革新。它支持流式实时计费,用户Token消耗的计费端到端时延控制在1分钟以内,真正做到了“按需使用,即用即付”。这种模式有效避免了传统预付费资源包可能产生的资源闲置与浪费,使得每一笔消费都清晰透明。
在风险控制层面,MoMA建立了完备的监控与审计机制,确保Token计费全流程可追溯、可审计、可闭环。这从根本上防范了资源被恶意占用、费用异常超支或服务意外中断的风险,保障了用户资源使用的稳定与可控。
更重要的是,平台提供了全景式的可观测能力。它能实时采集并分析接口时延、请求吞吐量、Token消耗量、GPU利用率等关键指标,将监控、预警、诊断功能整合为一体化运营仪表盘。这套体系覆盖客户管理、服务订购、资源使用、成本分析等多个维度,使AI投入产出比(ROI)一目了然,为用户的成本优化与战略决策提供坚实的数据支撑。

展望未来,中国移动表示将持续迭代升级移动模型服务平台MoMA的服务能力与效能。通过携手更广泛的产业合作伙伴,共同挖掘算力网络潜能,开拓智能化应用新场景,最终目标是推动人工智能技术更广泛、更高效、更安全地融入经济社会发展全局,释放数字新质生产力。
相关攻略
中国移动推出MoMA开放普惠大模型聚合平台,接入超300款主流模型。平台通过统一API和智能路由技术,实现一次接入即可调用所有模型,将调用成本降低约30%,并提供统一认证、调度、运维等全流程支持,旨在解决企业选型难、接入繁、成本高等痛点。
过去十余年间,国内电信运营商始终在探索“通信管道”之外的全新增长曲线。从语音业务到流量经营,再到如今全面拥抱人工智能与算力服务,运营商的角色定位正经历一场深刻的范式转移。近期召开的2026移动云大会,清晰地揭示了中国移动这家传统通信巨头,如何加速向科技服务型企业战略转型。 战略重塑:确立“三大主业”
在2026移动云生态大会上,中国移动重磅推出全新移动模型服务平台——MoMA。这一平台的发布,标志着大模型技术正加速从“技术研发”走向“产业落地”,其核心使命是推动人工智能能力像水电一样普及,实现AI服务的“随处可及、按需所用”。 一站式集成:汇聚300余款主流模型,实现“开箱即用” MoMA平台的
在中国移动2026移动云大会上,蓝芯算力联合中国移动云能力中心发布了RISC-V与BC-LINUX全栈融合方案。该方案以蓝芯LX500智通融合CPU为核心,该芯片采用32P+16E异构设计,并集成75TOPS的专用AI算力模块,结合深度优化的BC-LINUX操作系统,旨在构建从底层硬件到系统软件的
中国移动推出MoMA平台,集成超300款AI模型,提供一站式调用服务。其首创Token集约化运营与智能路由引擎,可动态匹配模型并实现故障秒级切换。通过自研推理引擎,单位Token成本降低约30%,资源占用率下降50%以上。平台还以全链路机密计算保障数据安全,并构建实时计量与风控体系,促进算力资源高效规范利用。
热门专题
热门推荐
近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十
科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,
SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。





