假设你是一名社区运营,手里要推一场夏季户外好物推荐活动。你需要在A系统创建话题,切到B系统配置活动,再打开会场搭建系统拖拽组件,最后提交审核。三个系统各自独立,字段却高度耦合——名字改一个字,另外两个地方也得跟着改。这种场景,估计不少人都经历过。
项目背景
一场营销活动从策划到上线,运营要在三个系统间跳转十多次、填写四十多个字段。我们索性用AI重新设计了一整条链路——从最初的“AI帮你填表单”,进化到现在的“两阶段袋里人+聚合工作台”。这篇文章不聊技术细节,重点聊聊这条路上的选择与反思。
先说第一个版本。
第一版探索:让AI帮你填表,但人还是主角
我们的第一反应很简单:让AI帮运营填字段。做了一个5步表单向导,AI在第一步解析策划文档,后续步骤中预填字段。AI的能力来自两个Dify Workflow——一个把策划文档解析成结构化字段,另一个把解析结果与系统的下拉选项做语义匹配。效果上,运营从“全部手填”变成了“AI预填+人工校验”。
上线后发现,操作时间确实缩短了,但远没有质的飞跃。原因很简单:范式没变。运营仍然是流程的主体,AI只是预填了一部分字段,你还是得理解每个字段、按顺序走完5步、在三个系统间跳转、自己判断AI填得对不对。更具体的问题包括:不可逆(文档解析错了就得从头来)、AI是黑盒(调用需要5-15秒等待,过程中没有真实反馈)、组件硬编码(只支持一个模板、5个组件)、没有持久化(刷新浏览器进度丢失)。
第一版给了我们一个重要认知:如果AI的角色只是“帮你填字段”,它永远不会带来质变。真正的变化应该是——AI来驱动流程,人只在关键节点做确认。这个认知其实和AI产品领域的规律一致:AI产品的价值跃迁,几乎都发生在“AI从辅助工具变成流程主体”的那个拐点上。GitHub Copilot从“行级补全”进化到“Copilot Workspace”,ChatGPT从“对话”进化到“GPTs+Actions”,都是同一个拐点的不同表现。
Agent CLI方案的可行性评估
在决定重写之前,我们也评估了一个更激进的方向:Agent CLI。OpenCode CLI、Cursor、Claude Code这类工具展示了另一种可能——用自然语言指导AI袋里人完成整个开发流程。理论上,会场搭建也可以用类似方式:运营说“我要做一个夏季户外主题活动”,袋里人自主完成话题创建、活动配置、组件搭建,完全不需要结构化的UI卡片。
这确实是未来,但当前落地有三个硬性障碍:第一,袋里人对会场的业务约束没有“体感”;第二,袋里人无法获取实时状态;第三,袋里人的操作缺少审计与可解释性。这让我们意识到:需要在“完全自主的袋里人”和“纯人工操作”之间找到一个合适的位置。
Anthropic的Agentic系统复杂度光谱正好提供了这个框架——它将AI系统的自主性从低到高分成多个层级。我们的工作流大致对应光谱中间的Prompt Chaining + Routing + Human-in-the-loop组合。这不是光谱上最复杂的位置,但对我们来说是最合适的位置。
第二版实现:从填表到审卡片
第二版是一次架构级的重写。核心理念用一句话概括:把运营从“流程执行者”变成“流程监督者”。运营要做的事情缩减为两件:提供信息(粘贴一份飞书策划文档链接)和关键确认(在AI弹出的结构化卡片上做校验和微调)。其他所有事情——抓取文档、解析字段、创建话题、创建活动、复制会场模板、配置组件——全部由工作流驱动完成。
在选技术方案之前,有一个更根本的问题需要先回答:我们需要的是一个Workflow(工作流)还是一个Agent(智能体)?我们的会场搭建流程有明确的步骤(解析→选组件→补字段→确认→构建),每步的完成条件是确定的,而且对正确率有极高要求。这显然更适合Workflow模式。但这不意味着完全不用袋里人能力。在局部场景中——比如AI改写规则文案、理解自然语言修改组件配置——我们使用了Agent式的LLM调用(给LLM工具,让它自主决定如何完成这个局部任务)。
一个实用的经验法则:如果你的业务流程可以被画成一张有限状态机图,那就用Workflow;如果它更像“给定一个目标,让AI自己想办法达到”,那就用Agent。大多数企业级场景是两者的混合——大框架用Workflow保证可控,局部节点用Agent提供灵活性。这个区分在行业中越来越被重视。LangChain的创始人Harrison Chase在多个场合强调过:当前大部分成功的AI应用都是Workflow而非Agent。Klarna的AI客服系统被广泛报道为“Agent”,但从架构上看,它更接近一个精心设计的Workflow——有明确的意图分类路由、有标准化的工具调用流程、有人工升级机制。真正在生产环境中跑“完全自主Agent”的案例仍然非常少。
选择LangGraph作为编排引擎
明确了需要Workflow之后,我们评估了多个方案,最终选择了LangGraph作为编排引擎。LangGraph是LangChain团队推出的状态编排引擎,MIT开源。它用有向图定义AI工作流:每个节点是一个处理步骤(可以是LLM调用、工具调用或人工确认),边定义了步骤之间的流转条件。内置Checkpointer机制可以持久化每个会话的完整状态,支持中断后恢复。
在我们的系统里,LLM不是“决策者”,而是“节点内的执行者”——在明确定义的节点里做信息解析和文案生成,不参与流程路由。
