模型介绍
近期,开源社区动作频频,MiniMax 与月之暗面相继发布了重磅模型——MiniMax 推出了全新的 MiniMax M3,月之暗面则发布了 Kimi K2.7 Code 编程模型。值得一提的是,PAI 平台已快速完成适配,支持用户一键部署并直接调用这两款前沿模型。
首先聚焦 MiniMax M3,它堪称国内首个“三合一”开源模型,集成了原生多模态、超长上下文、Agent 操作三大核心能力。在编码与智能体领域,M3 的基准测试表现十分突出,尤其在自主任务分解、工具调用以及多步骤推理等方面,为AI编码助手和自动化工作流奠定了坚实基础。

在软件工程和终端执行等国际权威评测中,M3 均展现出世界级水准。
接下来看 Kimi K2.7 Code,该模型的核心定位十分清晰——以代码能力为驱动的智能体模型。其最关键的提升在于处理真实、长周期的编码任务时,效率与完成度显著提升。此外,token 利用效率也得到优化,相比 Kimi K2.6,推理时的 token 消耗量减少了约 30%。

数据显示,Kimi K2.7 Code 在多项编程及 Agent 基准测试中,相比 K2.6 取得了 10% 至 31.5% 的性能提升,堪称一次扎实的迭代升级。
当然,PAI-Model Gallery 模型库中不止这两位新成员。像 Qwen3.6、DeepSeek-V4、Kimi K2.6、GLM-5.1 等前沿模型均可一键部署。特别值得关注的是,DeepSeek-V4 支持 Pro 和 Flash 全系列模型,并提供 FP8/Int8 量化版本,并可通过真武 810E 高效支撑推理(例如 DeepSeek-V4-Flash-Int8-W8A8 组合)。
一键部署 MiniMax M3 模型
部署流程十分简便,直接进入正题:
1. 进入 PAI-Model Gallery 模型广场,找到 MiniMax M3(或者直接用下方链接直达):
- MiniMax M3 模型:https://pai.console.aliyun.com/#/quick-start/models/MiniMax-M...
- MiniMax-M3-MXFP8 量化版:https://pai.console.aliyun.com/#/quick-start/models/MiniMax-M...

2. 在模型详情页右上角点击「部署」,选择合适的计算资源后,即可一键完成部署。

需注意部署框架的支持情况:MiniMax-M3 已支持 vLLM 和 SGLang 两种高性能推理框架,单机部署需配备 8 块 GPU;而 MiniMax-M3-MXFP8 版本目前仅支持 vLLM 框架的单机部署,同样需要 8 块 GPU。
3. 部署成功后,在服务页面点击「查看调用信息」,即可获取 调用地址和 Token。更详细的调用方式说明,可在模型详情页中找到。

一键部署 Kimi K2.7 Code 模型
部署流程与上述类似,具体步骤如下:
1. 在 PAI-Model Gallery 模型广场找到 Kimi K2.7 Code(或通过下方链接直达):
- Kimi K2.7 Code 编程模型:https://pai.console.aliyun.com/#/quick-start/models/Kimi-K2.7...

2. 点击「部署」,选择合适的计算资源即可完成。

Kimi K2.7 Code 同样支持 vLLM 和 SGLang 框架,并支持单机部署及 PD 分离部署,同样需要 8 块 GPU。
3. 部署成功后,获取调用信息的方式与 MiniMax 模型相同,按页面指引操作即可。
PAI-Model Gallery 简介
Model Gallery 是阿里云人工智能平台 PAI 的核心组件,它统一集成了国内外开源社区中的优质预训练模型,覆盖 LLM、AIGC、CV、NLP 等主流领域。PAI 已对这些模型进行了专门适配,用户可零代码完成从训练到部署、再到推理的全流程。简而言之,它有效降低了开发者和企业用户的模型落地门槛,大幅提升了效率。
目前,PAI-Model Gallery 已接入 MiniMax M3、Qwen3.6-35B-A3B、DeepSeek-V4、Kimi K2.6 以及 GLM-5.1 等最新主流模型,并提供企业级部署方案。其核心优势十分明确:零代码一键部署、自动适配云资源、开箱即用 API、全流程运维托管、企业级安全保障(数据不出域)。


更多模型支持
PAI-Model Gallery 模型更新频率很快,持续跟进开源社区的焦点模型,覆盖范围包括 Qwen、Wan、DeepSeek、Kimi、MiniMax 等主流系列。此外,平台还特别提供了 PAI 优化版本的模型,例如 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等,这些版本内置了 PAI 优化的 EP+PD 分离部署模板,性能表现更为优异。
