PAI现已支持全新MiniMax M3与Kimi K2.7 Code一键部署开源前沿触手可及_AI热点日报

PAI现已支持全新MiniMax M3与Kimi K2.7 Code一键部署开源前沿触手可及

类型：热点整理2026-07-02

模型介绍近期，开源社区动作频频，MiniMax 与月之暗面相继发布了重磅模型——MiniMax 推出了全新的 MiniMax M3，月之暗面则发布了 Kimi K2 7 Code 编程模型。值得一提的是，PAI 平台已快速完成适配，支持用户一键部署并直接调用这两款前沿模型。首先聚焦 MiniMax

模型介绍

近期，开源社区动作频频，MiniMax 与月之暗面相继发布了重磅模型——MiniMax 推出了全新的 MiniMax M3，月之暗面则发布了 Kimi K2.7 Code 编程模型。值得一提的是，PAI 平台已快速完成适配，支持用户一键部署并直接调用这两款前沿模型。

首先聚焦 MiniMax M3，它堪称国内首个“三合一”开源模型，集成了原生多模态、超长上下文、Agent 操作三大核心能力。在编码与智能体领域，M3 的基准测试表现十分突出，尤其在自主任务分解、工具调用以及多步骤推理等方面，为AI编码助手和自动化工作流奠定了坚实基础。

在软件工程和终端执行等国际权威评测中，M3 均展现出世界级水准。

接下来看 Kimi K2.7 Code，该模型的核心定位十分清晰——以代码能力为驱动的智能体模型。其最关键的提升在于处理真实、长周期的编码任务时，效率与完成度显著提升。此外，token 利用效率也得到优化，相比 Kimi K2.6，推理时的 token 消耗量减少了约 30%。

数据显示，Kimi K2.7 Code 在多项编程及 Agent 基准测试中，相比 K2.6 取得了 10% 至 31.5% 的性能提升，堪称一次扎实的迭代升级。

当然，PAI-Model Gallery 模型库中不止这两位新成员。像 Qwen3.6、DeepSeek-V4、Kimi K2.6、GLM-5.1 等前沿模型均可一键部署。特别值得关注的是，DeepSeek-V4 支持 Pro 和 Flash 全系列模型，并提供 FP8/Int8 量化版本，并可通过真武 810E 高效支撑推理（例如 DeepSeek-V4-Flash-Int8-W8A8 组合）。

一键部署 MiniMax M3 模型

部署流程十分简便，直接进入正题：

1. 进入 PAI-Model Gallery 模型广场，找到 MiniMax M3（或者直接用下方链接直达）：

MiniMax M3 模型：https://pai.console.aliyun.com/#/quick-start/models/MiniMax-M...
MiniMax-M3-MXFP8 量化版：https://pai.console.aliyun.com/#/quick-start/models/MiniMax-M...

2. 在模型详情页右上角点击「部署」，选择合适的计算资源后，即可一键完成部署。

需注意部署框架的支持情况：MiniMax-M3 已支持 vLLM 和 SGLang 两种高性能推理框架，单机部署需配备 8 块 GPU；而 MiniMax-M3-MXFP8 版本目前仅支持 vLLM 框架的单机部署，同样需要 8 块 GPU。

3. 部署成功后，在服务页面点击「查看调用信息」，即可获取 调用地址和 Token。更详细的调用方式说明，可在模型详情页中找到。

一键部署 Kimi K2.7 Code 模型

部署流程与上述类似，具体步骤如下：

1. 在 PAI-Model Gallery 模型广场找到 Kimi K2.7 Code（或通过下方链接直达）：

Kimi K2.7 Code 编程模型：https://pai.console.aliyun.com/#/quick-start/models/Kimi-K2.7...

2. 点击「部署」，选择合适的计算资源即可完成。

Kimi K2.7 Code 同样支持 vLLM 和 SGLang 框架，并支持单机部署及 PD 分离部署，同样需要 8 块 GPU。

3. 部署成功后，获取调用信息的方式与 MiniMax 模型相同，按页面指引操作即可。

PAI-Model Gallery 简介

Model Gallery 是阿里云人工智能平台 PAI 的核心组件，它统一集成了国内外开源社区中的优质预训练模型，覆盖 LLM、AIGC、CV、NLP 等主流领域。PAI 已对这些模型进行了专门适配，用户可零代码完成从训练到部署、再到推理的全流程。简而言之，它有效降低了开发者和企业用户的模型落地门槛，大幅提升了效率。

目前，PAI-Model Gallery 已接入 MiniMax M3、Qwen3.6-35B-A3B、DeepSeek-V4、Kimi K2.6 以及 GLM-5.1 等最新主流模型，并提供企业级部署方案。其核心优势十分明确：零代码一键部署、自动适配云资源、开箱即用 API、全流程运维托管、企业级安全保障（数据不出域）。

更多模型支持

PAI-Model Gallery 模型更新频率很快，持续跟进开源社区的焦点模型，覆盖范围包括 Qwen、Wan、DeepSeek、Kimi、MiniMax 等主流系列。此外，平台还特别提供了 PAI 优化版本的模型，例如 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等，这些版本内置了 PAI 优化的 EP+PD 分离部署模板，性能表现更为优异。

来源：https://segmentfault.com/a/1190000047948217

MiniMax

延伸阅读

补充最近整理过的热点入口。