在阿里云服务器上部署AI Agent并接入百炼Token Plan,可以说是当前搭建稳定、低成本、可规模化运行的AI智能体服务最直接的路径。依托阿里云服务器的稳定算力,再配合百炼Token Plan统一的Credits计费模式,AI Agent可以实现多模型调用、上下文记忆、工具执行等一系列核心能力,整个过程完全不用操心复杂的运维,无论是个人开发者、小团队还是业务落地场景都能快速上手。这里以主流的Hermes Agent为例,从部署前的准备工作、服务器选型与创建、百炼Token Plan的开通与凭证获取、AI Agent的部署与配置,再到功能验证和常见问题排查,给出一个完整的实操流程。同时覆盖了轻量应用服务器一键部署和ECS手动部署两种方案,新手和老手都能找到适合自己的方式。
一、部署前核心准备
1.1 阿里云账号与实名认证
首先需要注册并登录阿里云账号,完成个人或企业的实名认证。这是后续购买云服务器、开通百炼Token Plan以及获取API密钥的必要前提。个人用户直接用支付宝授权就能快速完成认证,企业用户则需要上传营业执照进行审核。如果打算用RAM子账号操作,记得让主账号分配好ECS管理员、百炼管理员等权限,确保有创建实例、修改配置、管理服务等操作的权限。
1.2 开通阿里云百炼Token Plan(核心步骤)
百炼Token Plan是一个面向团队和规模化场景的订阅服务,采用Credits统一积分计费,支持全平台模型调用,对于AI Agent的长期稳定运行来说非常理想。具体操作:
- 登录阿里云百炼大模型服务平台,进入“Token Plan”订阅页面。
- 选择套餐档位:标准版(198元/月,25000 Credits)、高级版(698元/月,100000 Credits)、尊享版(1398元/月,250000 Credits)。根据实际使用需求选择单月或连续包月,完成支付订阅。
- 获取Token Plan专属API Key:进入百炼控制台“API密钥管理”页面,点击“创建API Key”,选择“Token Plan专属API Key”(格式为
sk-sp-xxxxxx),生成后立即复制保存——关闭弹窗后就没法再看到了,而且绝对不能泄露。 - 记录Token Plan专属Base URL:OpenAI兼容协议地址为
https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1,Anthropic兼容协议地址为https://token-plan.cn-beijing.maas.aliyuncs.com/apps/anthropic,后续配置AI Agent时要用到。
1.3 本地工具与环境准备
- 远程连接工具:准备好FinalShell、Xshell或者阿里云Web终端,用来SSH连接服务器执行命令。
- 文本编辑器:用来保存Token Plan API Key、访问Token等敏感信息,避免丢失。
- 地域选择:优先选择华北2(北京)或海外地域(比如中国香港、美国弗吉尼亚)。国内除了香港以外的地域,联网搜索功能会受限;海外地域不需要ICP备案,可以直接通过公网IP访问。
二、阿里云服务器创建与基础配置
2.1 方案一:轻量应用服务器一键部署(新手推荐)
轻量应用服务器的操作非常简单,成本也低,而且预装了Hermes Agent镜像,连手动配置环境的步骤都省了,特别适合零基础的用户。
- 登录阿里云轻量应用服务器控制台,点击“创建实例”。
- 选择配置:
- 镜像:选择“应用镜像”→“Hermes Agent”(所有依赖都已经预装好)。
- 实例规格:基础场景选2核2GiB就够了,复杂场景可以升级到4核4GiB。
- 地域:优先选择华北2(北京)或海外地域。
- 时长:根据需求选择1个月、3个月或更长时间。
- 完成支付,等待5-10分钟,实例状态变为“运行中”。
- 端口放通:进入实例“应用详情”页面,找到“端口放通”区域,点击“一键放通”,系统会自动放行22(SSH)和18789(Hermes Agent Web UI访问)端口。
零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程
第一步:打开访问阿里云OpenClaw/Hermes Agent一键部署专题页面。
第二步:打开选择阿里云轻量应用服务器,配置参考如下:
- 镜像:OpenClaw(或Hermes Agent)镜像(已经购买服务器的用户可以重置系统重新选择镜像)
- 实例:内存必须2GiB及以上。
- 地域:默认美国(弗吉尼亚),目前中国内地域(除香港)的轻量应用服务器,联网搜索功能受限。
- 时长:根据自己的需求及预算选择。
第三步:打开访问阿里云百炼大模型控制台,找到密钥管理,单击创建API-Key。
前往轻量应用服务器控制台,找到安装好OpenClaw的实例,进入「应用详情」放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。
- 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
- 配置百炼API-Key,单击一键配置,输入百炼的API-Key。单击执行命令,写入API-Key。
- 配置OpenClaw/Hermes:单击执行命令,生成访问OpenClaw/Hermes的Token。
- 访问控制页面:单击打开网站页面可进入OpenClaw/Hermes对话页面。
阿里云百炼Coding Plan API-Key 获取、配置保姆级教程:
创建API-Key,推荐访问订阅阿里云百炼Coding Plan,阿里云百炼Coding Plan每天两场抢购活动,从按tokens计费升级为按次收费,可以进一步节省费用!
- 购买后,在控制台生成API Key。注:这里复制并保存好你的API Key,后面要用。
回到轻量应用服务器-控制台,单击服务器卡片中的实例 ID,进入服务器概览页。
在服务器概览页面单击应用详情页签,进入服务器详情页面。
端口放通在OpenClaw使用步骤区域中,单击端口放通下的执行命令,可开放获取OpenClaw 服务运行端口的防火墙。
这里系统会列出我们第一步中创建的阿里云百炼 Coding Plan的API Key,直接选择就可以。
获取访问地址单击访问 Web UI 面板下的执行命令,获取 OpenClaw WebUI 的地址。
2.2 方案二:ECS云服务器手动部署(进阶自定义)
ECS实例的灵活性更高,支持自定义系统和环境,适合有运维经验的用户。
- 登录阿里云ECS控制台,点击“创建实例”。
- 选择配置:
- 实例规格:基础场景2核2GiB,复杂场景4核4GiB及以上。
- 镜像:选择Alibaba Cloud Linux 3或Ubuntu 20.04及以上版本。
- 系统盘:选择40GiB以上ESSD云盘。
- 网络:选择“专有网络(VPC)”,启用公网IP,安全组选择默认安全组。
- 登录凭证:设置登录密码或密钥对。
- 完成支付,等待实例创建完成,复制公网IP备用。
- 安全组配置:进入ECS实例“安全组”页面,添加规则:协议TCP,端口22、18789,策略允许,来源0.0.0.0/0(测试阶段)。
- SSH连接服务器:使用远程连接工具连接ECS实例,更新系统并安装依赖:
# Ubuntu/Debian
sudo apt update && sudo apt upgrade -y
sudo apt install python3 python3-pip nodejs git docker.io -y
# CentOS
sudo yum update -y
sudo yum install python3 python3-pip nodejs git docker -y
三、AI Agent(Hermes)部署与百炼Token Plan配置
3.1 轻量应用服务器一键配置(新手推荐)
- 进入轻量应用服务器实例“应用详情”页面,找到“配置Hermes”区域。
- 点击“初始化配置百炼API Key”,在弹出窗口中填写:
- 模型厂商:阿里云百炼
- 认证方式:Token Plan API Key:粘贴Token Plan专属API Key(
sk-sp-xxxxxx) - Base URL:粘贴OpenAI兼容协议地址
https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1 - 默认模型:选择
qwen3.7-max或qwen3.6-plus
- 点击“确定”,系统自动执行配置命令,写入Hermes配置文件。
- 点击“生成访问Token”,复制保存Web UI访问凭证——这是访问AI Agent的唯一密钥,绝对不要泄露。
3.2 ECS服务器命令行配置(进阶用户)
SSH连接ECS实例,安装Hermes Agent:
curl -fsSL https://hermes.ai/install.sh | bash
配置百炼Token Plan参数,执行以下命令(替换API Key为实际值):
hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-xxxxxxxxxxxxxxxxxxxxxxxx
hermes config set model.default qwen3.7-max
hermes config set gateway.port 18789
启动Hermes Agent服务:
hermes run
生成Web UI访问Token:
hermes token generate
复制生成的Token,用于后续访问Web UI。
3.3 手动编辑配置文件(高级定制)
如果需要更精细的配置,可以直接编辑Hermes配置文件~/.hermes/config.yaml:
model:
default: qwen3.7-max
provider: custom
base_url: https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
api_mode: openai_messages
api_key: sk-sp-xxxxxxxxxxxxxxxxxxxxxxx
temperature: 0.7
max_tokens: 65536
gateway:
port: 18789
auth_token: 生成的Web UI访问Token
编辑完成后,重启Hermes服务使配置生效:
hermes restart
四、AI Agent功能验证与Token Plan使用确认
4.1 访问AI Agent Web UI
在浏览器中输入https://服务器公网IP:18789,使用生成的访问Token登录,进入Hermes Agent控制台。控制台可以看到模型列表、对话历史、技能配置、日志等信息。
4.2 发起对话与工具调用验证
- 在Web UI中选择默认模型(比如
qwen3.7-max),输入一个测试指令,例如“介绍一下阿里云百炼Token Plan”。 - 验证AI Agent响应:如果能正常返回内容,说明模型调用成功了。
- 验证工具执行:输入“帮我写一段Python代码,实现两数相加”,确认AI Agent能生成并执行代码。
4.3 确认Token Plan额度消耗
登录阿里云百炼控制台,进入“Token Plan”用量统计页面,查看实时Credits消耗数据。确认AI Agent调用模型时,正常抵扣的是Token Plan额度,而不是按量计费,这样能避免产生额外费用。如果没有消耗,需要检查API Key和Base URL是否正确,以及配置文件中model.provider是否设为custom。
五、AI Agent功能扩展与优化配置
5.1 启用技能与工具
Hermes Agent支持文件处理、代码执行、联网搜索、数据查询等技能,可以在Web UI的“技能管理”页面启用。所有技能调用模型时,都会统一使用Token Plan额度,不需要额外配置。
5.2 调整模型参数
在配置文件中可以调整temperature(控制输出随机性,范围0-1)和max_tokens(最大响应长度)等参数,以适应不同场景。比如精准问答场景可以把temperature设为0.2,创意生成场景则设为0.7。
5.3 配置开机自启
为了确保服务器重启后AI Agent能自动运行,可以配置开机自启:
sudo vim /etc/rc.local
# 添加以下内容(替换为实际路径)
cd /root/.hermes
nohup hermes run > hermes_service.log 2>&1
# 保存退出后,添加执行权限
sudo chmod +x /etc/rc.local
# 重启服务器验证
sudo reboot
5.4 安全配置优化
- 测试完成后,把安全组来源修改为指定IP白名单,禁止公网随意访问。
- 定期更新Hermes Agent版本,获取最新功能和安全修复:
hermes update - 启用Web UI访问鉴权,确保只有授权用户能访问。
六、常见问题排查
6.1 AI Agent无法连接百炼Token Plan
- 检查API Key是否属于Token Plan专属(格式
sk-sp-xxxxxx),不要误用了通用API Key。 - 确认Base URL是Token Plan专属地址,而不是通用的dashscope地址。
- 检查服务器网络能否访问阿里云百炼服务,试试ping通Base URL域名。
6.2 模型调用失败,无响应
- 确认Token Plan Credits额度充足,没有被耗尽。
- 检查默认模型名称是否正确,必须和百炼Token Plan支持的模型名称完全一致。
- 重启Hermes服务,重新加载配置。
6.3 Web UI无法访问
- 确认服务器已经放通18789端口,安全组规则配置正确。
- 检查访问Token是否正确,没有过期或泄露。
- 尝试重启Hermes服务和服务器。
6.4 Token Plan额度消耗异常
- 优化对话历史长度,减少上下文占用。
- 降低
temperature参数,减少模型冗余输出。 - 简单任务选择轻量模型,复杂任务再切换高性能模型。
七、总结
在阿里云服务器上部署AI Agent并配置百炼Token Plan,确实是一条实现AI智能体稳定、低成本、规模化运行的高效路径。轻量应用服务器的一键部署方案让新手能快速上手,ECS手动部署则给进阶用户留下了充分的定制空间;而百炼Token Plan提供的统一Credits计费,支持多模型调用和团队管控,刚好满足AI Agent长期使用的各种需求。
从部署前的准备、服务器创建、Token Plan开通与凭证获取,到AI Agent的部署、配置、验证与优化,整个流程非常清晰,不需要复杂的AI开发经验就能完成。部署完成后,AI Agent就可以作为强大的数字助手,执行对话交互、代码编写、工具调用、流程自动化等任务,大幅提升个人和团队的工作效率。同时,依托阿里云的稳定算力和百炼的模型能力,业务落地和规模化扩展也变得轻松许多——这才是把AI技术真正用起来的方式。
