在2026移动云生态大会上,中国移动重磅推出全新移动模型服务平台——MoMA。这一平台的发布,标志着大模型技术正加速从“技术研发”走向“产业落地”,其核心使命是推动人工智能能力像水电一样普及,实现AI服务的“随处可及、按需所用”。
一站式集成:汇聚300余款主流模型,实现“开箱即用”
MoMA平台的核心优势在于其卓越的“聚合”与“集成”能力。平台通过统一的API接口,为用户提供了极其便捷的调用入口。一次接入,即可便捷调用涵盖300多款业界主流大模型,其中也包括中国移动自研的“九天”系列基座大模型。
从国内领先的DeepSeek、通义千问、Kimi,到豆包、智谱GLM等,各类优质模型均已整合入驻。这种集成并非简单的模型列表,而是构建了覆盖文本理解、代码生成、语音交互及多模态识别的完整能力矩阵,旨在深度满足金融、教育、医疗、政务等各行业复杂且差异化的业务需求。
智能调度:化解模型选择难题,实现最优资源匹配
面对众多模型,企业如何高效选型?MoMA的解决方案是“智能模型调度”。平台创新的智能路由引擎,能够智能解析用户任务意图,并在“成本优先”、“效果优先”与“均衡优先”等多种策略间动态调配。
平台尤为注重业务的高可用保障。当某一模型服务出现异常或流量受限时,系统可实现秒级自动故障转移,保障业务连续性。同时,基于国产化算力底座的自研推理引擎,结合智能缓存、请求合并等优化技术,成功将单位Token的推理成本降低了30%以上,资源利用率提升超过50%。这直接帮助企业以更低的投入,获得更高的AI产出效率。
安全底座:业内首推“机密计算”模型服务,守护数据隐私
针对政务、金融、医疗等对数据安全极为敏感的行业,MoMA创新性地推出了“机密模型”服务。该服务通过硬件级可信执行环境(TEE)等隔离技术,将模型部署于加密的机密容器中,确保训练与推理全过程“数据可用不可见”,构建了从底层硬件、运行环境到应用服务的全链路安全防护体系。
闭环运营:实现算力消费透明化与精细化管控
在运营管理层面,MoMA平台践行集约化、精细化的理念,对Token消耗进行全生命周期监控。平台支持实时流式计费,用户账单延迟控制在1分钟以内,真正做到消费明细实时可视,支持“用多少付多少”的灵活模式。
此外,平台提供的全链路可观测性,让开发者能实时监控API调用延迟、吞吐量、GPU使用率等核心指标。这种透明的资源损耗记录与风险管控机制,不仅有效避免了资源浪费,也为企业进行AI项目的成本核算与投资回报分析提供了清晰、可靠的数据支撑。
