大年初六,咱们直接聊点实际的——阿里云PAI Model Gallery已经支持云上一键部署DeepSeek-V3和DeepSeek-R1模型了。这意味着什么?你无需编写任何代码,就能在云端轻松运行这两个模型。
PAI Model Gallery这个平台,本质上就是一个“模型超市”。你进入后挑选模型,点击几下鼠标,训练、部署、推理全流程便会自动完成。对于开发者和企业用户而言,这无疑是一款能显著提升效率的工具——省去了搭建环境、配置依赖、调优部署参数等繁琐环节。

具体怎么操作?我们分成三步来走。
第一步:进入Model Gallery页面
先打开PAI控制台,链接是这个:https://pai.console.aliyun.com/#/quick-start/models。登录后,在页面顶部左上角根据实际需求选择地域。然后在左侧导航栏找到“工作空间列表”,单击指定工作空间的名称进入。最后,在左侧导航栏依次选择“快速开始” > “Model Gallery”,就来到了模型大厅。
第二步:找到DeepSeek模型
在Model Gallery的模型列表里,直接搜索或浏览,找到你需要的模型卡片。例如,如果你想部署“DeepSeek-R1-Distill-Qwen-7B”这个蒸馏版本,点进去就能看到它的详情页。
第三步:一键部署,生成服务
在模型详情页的右上角,你会看到一个醒目的“部署”按钮。点击它。这里有个关键信息:不同模型支持的加速框架不一样。
具体来说:
- DeepSeek-R1:支持采用vLLM进行加速部署。
- DeepSeek-V3:支持vLLM加速部署,也支持Web应用部署方式。
- DeepSeek-R1蒸馏小模型:支持BladeLLM(阿里云PAI自研的高性能推理框架)和vLLM两种加速方式。
选好部署方式和需要的计算资源后,一键点击,平台就会自动创建一个PAI-EAS服务。部署成功后,在服务页面点击“查看调用信息”,就能拿到服务的Endpoint和Token。至于具体的调用方式,返回模型介绍页面就能看到详细说明。
需要特别说明的是,本次教程选择部署的是蒸馏模型——DeepSeek-R1-Distill-Qwen-7B。为什么选这个?主要是为了在性价比与实用性之间找到一个最佳平衡点。该模型通过蒸馏技术,将DeepSeek-R1强大的推理能力迁移到了更小的Qwen模型上,在保持高效性能的同时,大幅降低了计算成本。
当然,如果你的业务场景需要,阿里云PAI Model Gallery同样提供了DeepSeek-R1和DeepSeek-V3原始模型的一键部署入口。
