前记:从硬编排到自主智能体
最近一直在探索 agent 工作流编排,因为在企业内部的故障诊断与根因分析场景里,智能体的应用需求越来越迫切。早期我采用的是硬编排方式,把流程固定写死、一步步调用——但坦白说,这种硬编码的智能体离真正的“智能”还有很大距离。通过深入调研 Agent 和 MCP 的实现方案,才真正理解:一个真正意义上的智能体,应当能借助提示词自主编排工作流,自行调用工具和知识库,结合记忆来规划、决策、执行,最终高效输出我们想要的结果。
下图展示了这种自主智能体的整体架构:

01|AI智能体(AI Agent)介绍
注:本节内容参考了 code秘密花园老师的文章。
AI 智能体是大语言模型与工具集的深度融合体,本质上是一种能够自主感知环境、做出决策、采取行动并与环境交互的智能应用。下面从多个维度展开说明。
核心组件
- LLM:大语言模型作为智能体的“大脑”,负责协调决策与制定行动计划。它根据任务进行推理,选择合适的工具,管理数据访问权限,并逐步推进至目标达成。
- 记忆模组:智能体依靠记忆维持上下文,能根据正在进行的任务或历史记录动态调整,为决策和行动提供参考依据。
关键特性
- 自主性:无需人类直接干预,智能体可依据预设目标和规则,自主分析环境、做出决策并执行动作。例如用于网站构建的智能体,能自主管理布局设计、编写 HTML/CSS,极大减少人工输入。
- 适应性:智能体可根据环境变化与任务需求,灵活调整行为和策略。太空探索中的探测器智能体,正是通过实时感知环境来动态优化探测策略的典型。
- 交互性:智能体能与环境、其他智能体乃至人类进行交互。在 VR/AR 场景中,它扮演虚拟伙伴角色,与用户展开自然流畅的互动。
主要功能
- 决策与解决问题:分析各类情况,权衡利弊,做出决策以解决复杂问题。导航系统中的智能体可实时考虑交通状况、路况信息,推荐最优路线。
- 与外部环境交互:智能工厂中的智能体与生产设备、机器人通信协作,实现生产流程的自动化与优化。
- 执行操作:根据决策结果执行具体动作。例如收到“买一杯咖啡”的指令后,智能体能自动调用外卖 APP 下单、调用支付 APP 付款,一气呵成。
应用场景
- 客户服务:智能体提供 7×24 小时全天候支持,能理解自然语言查询,代表客户处理复杂问题。呼叫中心的聊天机器人可自动执行退款审核等流程。
- 协助软件开发:GitHub Copilot 等工具可生成代码、提出编码建议、管理文档并修复错误,极大提升开发效率。
- 供应链管理:多智能体系统通过实时分析数据,监控和调整库存水平,甚至根据市场波动辅助采购原材料。
02|MCP 介绍

MCP(Model Context Protocol,模型上下文协议)是 Anthropic 推出的开放标准协议,旨在解决 AI 模型与外部数据源、工具之间的交互难题。下图清晰展示了 MCP Server、MCP Client、MCP HOST 之间的关系。
本文使用的 MCP HOST 工具是 Cherry Studio。在企业内网环境中,更倾向于使用 Dify 作为 MCP HOST。
03|用 FastMCP 搭建 MCP Server
Python 生态中已有成熟的 FastMCP 框架,搭建一个 MCP Server 仅需几行代码。下面是一个简单示例:
# main.py
from fastmcp import FastMCP
mcp = FastMCP("Demo", port=9000)
@mcp.tool()
def add(a: int, b: int) -> int:
"Add two numbers"
return a + b + 1 # 故意多加1,方便后续观察大模型是否调用此方法
在 Python 3.10 环境中运行以上代码即可启动 MCP Server。启动成功的截图如下:

04|MCP HOST(Cherry Studio)配置及使用
-
安装 Cherry Studio(下载地址:https://www.cherry-ai.com/download),并打开 MCP 配置界面。

-
配置 MCP Server:在 Cherry Studio 中添加对应配置。

-
启用 MCP Server:在 Cherry Studio 中启用已配置的服务。
-
选择大模型并启用:配置大模型过程不再赘述——本质上只需登录公有大模型平台,填入对应 token。此处使用了硅基流动的大模型,登录后 token 自动填充,非常便捷。
在会话窗口输入“add 5 and 4”,可以看到大模型直接调用之前配置的 add MCP Server 方法进行计算并返回结果。结果比正确值多了 1,这正是代码中故意加 1 的体现。更有趣的是,大模型还主动对错误的计算结果进行了纠错——这一点值得深入思考。

在这个示例中,Cherry Studio 将硅基流动的大模型与配置的 MCP Server 封装成一个轻量级 Agent 智能体,完整实现了智能体通过 MCP 协议调用 MCP Server,自主完成一次加法计算的简易流程。
05|总结
本文介绍了一个 Agent 智能体调用 MCP Server 的简易 Demo。在实际生产环境中,这个示例显然不够完善。日常工作中经常需要用到 HTTP RESTful API,接下来将尝试用 Python 的通用框架 FastAPI 同时实现 HTTP RESTful 和 MCP Server,封装成一个更完整的 Demo。后续内容请大家持续关注。
