游乐游手机版
首页/AI教程/文章详情

我的Agent工作流拆解:需求处理从3天缩短至1天实录

时间:2026-06-18 16:53
一个需求从 3 天到 1 天:Agent 工作流拆解实录 **副标题:** 不是 AI 替你写代码,是你设计流程、Agent 跑执行 --- 上周完成了一个后端需求迁移:**把用户权限模块从「角色硬编码」迁到「RBAC 策略引擎」**。 按传统做法,这种活心理预期是 **3 个工作日**: -
# 一个需求从 3 天到 1 天:Agent 工作流拆解实录 一个需求从 3 天到 1 天:Agent 工作流拆解实录 **副标题:** 不是 AI 替你写代码,是你设计流程、Agent 跑执行 --- 上周完成了一个后端需求迁移:**把用户权限模块从「角色硬编码」迁到「RBAC 策略引擎」**。 按传统做法,这种活心理预期是 **3 个工作日**: - Day 1:读代码、画改动范围、改接口层 - Day 2:跨包迁移权限判断逻辑、补单测 - Day 3:跑集成测试、修边界 case、写 PR 实际做完,**7 小时收工,当天合并**。 不是代码量变少,而是 **执行层时间被 Agent 吃掉了**——人做的是流程设计和验收标准制定,Agent 跑的是重复劳动。 下面就把整套流水线操作方式拆解出来。 --- ## 一、先说结论:时间省在哪? | 阶段 | 传统做法 | Agent 工作流 | 耗时变化 | |------|---------|-------------|---------| | 读代码、画范围 | 手动 grep 翻文档 | Claude Code `/init` 结构化扫描 | 4h → 1h | | 接口层改动 | 手写 复制粘贴 | Cursor Tab + Cmd K | 5h → 2h | | 跨包逻辑迁移 | 人工逐文件改 | Claude Code 端到端 + 跑测试 | 8h → 3h | | 集成测试排查 | 反复手动跑、猜 | Agent 读日志循环修 | 4h → 1.5h | | PR / 文档 | 手写 | 模板化生成 + 人审 | 1.5h → 0.5h | | **合计** | **~22.5h(约 3 天)** | **~7h(1 天)** | **~3.2x** | 关键不在于「AI 更聪明」,而是 **把任务拆成了 Agent 能闭环执行的单元**。 --- ## 二、需求背景:为什么这个活适合 Agent? 这个需求有几个特征: - **改动面大**:8 个包、30+ 文件涉及权限判断 - **模式重复**:大量 `if role == admin` 要换成策略调用 - **验收清晰**:单测 + 集成测试全绿 = 可合并 - **边界明确**:不动数据库 schema,只改应用层 这种任务最适合 Agent:**重复模式多、规则清晰、能用测试自动验收**。 反过来,如果是「重新设计权限模型该长什么样」,那仍然是人主导,Agent 只能辅助。 --- ## 三、开工前:30 分钟搭好「Agent 施工环境」 ### 3.1 写 CLAUDE.md(一次性投入,长期回本) 在项目根目录跑: ``` /init ``` 然后手工补上关键约束: ```markdown # 项目说明 Go 微服务,Gin + PostgreSQL,权限模块在 internal/auth/。 # 本次需求约束 - 目标:角色硬编码 → RBAC 策略引擎 - 不改 DB schema - 所有权限判断统一走 authz.Check(user, action, resource) - 测试必须全绿才能提交 # 常用命令 - 单测:go test ./internal/auth/... - 全量:go test ./... - 集成:make test-integration # 禁止 - 不要改 migrations/ - 不要引入新依赖未经确认 ``` **这一步的价值:** 后面每个 Agent 会话不用重复解释项目,平均每个会话省 5~10 分钟。 ### 3.2 开 Git 分支 + 定义验收标准 ```bash git checkout -b feat/rbac-migration ``` 验收标准写进任务描述(后面直接贴给 Agent): ``` 完成标准: 1. internal/auth/ 下所有权限判断走 authz.Check 2. go test ./... 全绿 3. make test-integration 全绿 4. 无硬编码 role 字符串残留(grep 验证) ``` **人只做两件事:定边界、定验收。** --- ## 四、Phase 1:摸清改动范围(1 小时) ### 工具:Claude Code(Sonnet) ### Prompt 模板 ``` 请分析本仓库权限相关代码: 1. 列出所有硬编码 role 判断的文件和行号 2. 按改动风险分级(高/中/低) 3. 给出分 3 批迁移的顺序建议 4. 输出为 Markdown 表格 约束:不改代码,只分析。参考 CLAUDE.md。 ``` ### 产出物 Agent 给出一张表: | 文件 | 风险 | 建议批次 | 备注 | |------|------|---------|------| | handler/user.go | 高 | Batch 1 | 入口层先改 | | service/order.go | 中 | Batch 2 | 依赖 auth 包 | | ... | ... | ... | ... | ### 人工动作(15 分钟) - 快速扫一眼有没有漏网文件 - 调整批次顺序(比如先改 auth 包本身) - **确认后再进入执行阶段** > 关键原则:**先 Plan,后 Execute。** 这一步省了后面大量返工。 --- ## 五、Phase 2:接口层 + 单测骨架(2 小时) ### 工具:Cursor(Tab 补全 + Cmd K) 这一层改动文件少、模式固定,Cursor 最高效。 ### 典型操作 1. 打开 `internal/auth/authz.go`,用 Tab 补全 `Check()` 方法骨架 2. 选中旧权限函数,Cmd K: ``` 把这个函数改为调用 authz.Check(),保持原有行为,补上单测 ``` 3. 对 handler 层逐个文件做同样操作 ### 为什么不用 Claude Code? - 单文件改动,Cursor 的 Diff 预览更直观 - 改一行、看一眼、改一行,节奏快 - 不消耗 Claude Code 的长会话额度 ### 本阶段产出 - `authz.Check()` 核心实现 - handler 层 6 个文件改完 - 对应单测 12 个全绿 --- ## 六、Phase 3:跨包迁移(3 小时,最值钱的一段) ### 工具:Claude Code(Sonnet,一个 Batch 一个会话) ### Prompt 模板(Batch 2 示例) ``` 执行 Batch 2 权限迁移(见上轮分析表格)。 要求: 1. 只改 Batch 2 列出的文件 2. 硬编码 role 判断全部替换为 authz.Check() 3. 每改完一个包,跑 go test .//... 4. 失败就修到绿,再继续下一个 5. 完成后 grep 确认无遗漏 验收:go test ./internal/service/... 全绿 ``` ### Agent 实际执行循环 ``` 读文件 → 改代码 → 跑测试 → 看报错 → 再改 → 再跑 → 绿了 → 下一个 ``` 这要是人来做,最容易卡在「改完忘了跑测试」「报错不知道改哪」。Agent 的优势是 **不知疲倦地重复这个循环**。 ### 需要介入的 3 个时刻 1. **Batch 边界确认**:Agent 想改 Batch 3 的文件,喊停——「只做 Batch 2」 2. **策略语义决策**:`admin` 能否访问 `audit:read`?业务规则人定,Agent 写代码 3. **全量测试前检查**:`grep -r "role ==" internal/` 确认无残留 ### 本阶段产出 - 8 个包迁移完成 - `go test ./...` 全绿 --- ## 七、Phase 4:集成测试排查(1.5 小时) ### 工具:Claude Code(Sonnet) 集成测试挂了 2 个 case,典型报错: ``` --- FAIL: TestOrderCreate_RequiresWritePermission expected 403, got 200 ``` ### Prompt ``` make test-integration 失败了,日志如下: 请: 1. 定位根因(权限策略配置还是调用路径) 2. 修复代码 3. 重跑 make test-integration 直到全绿 4. 说明改了什么、为什么 ``` Agent 两轮修好: - Case 1:策略表缺了一条 `order:create` 规则 → 补上 - Case 2:测试用的 mock user 角色没更新 → 改测试数据 ### 人工动作 - 看 Agent 的解释,确认业务语义没错 - 重点 Review 策略表变更(这是「判断层」,不能盲信) --- ## 八、Phase 5:PR 收尾(0.5 小时) ### Prompt ``` 基于本次改动,生成 PR 描述,包含: 1. 背景和目标 2. 改动范围(按包列出) 3. 测试证据(贴 go test 结果摘要) 4. 风险点和回滚方式 5. 给 Reviewer 的检查清单 风格:简洁技术风,中文 ``` 产出直接贴 GitHub,人工只改了两处措辞。 --- ## 九、完整时间线(一张图) ``` 09:00 - 09:30 搭环境(CLAUDE.md + 分支 + 验收标准) 09:30 - 10:30 Phase 1 分析范围(Claude Code) 10:30 - 12:30 Phase 2 接口层(Cursor) 13:30 - 16:30 Phase 3 跨包迁移(Claude Code × 3 Batch) 16:30 - 18:00 Phase 4 集成测试(Claude Code) 18:00 - 18:30 Phase 5 PR 收尾 ───────────────────────────────── 合计:~7h,当天合并 ``` --- ## 十、踩过的 3 个坑(帮你省返工) ### 坑 1:一上来就让 Agent 「全部改完」 结果:改了 20 个文件,测试红一片,不知道回滚到哪。 **修法:** 分批迁移,每批验收后再进下一批。 ### 坑 2:不写验收标准,只说「帮我做 RBAC」 结果:Agent 自作主张改了 migrations,差点踩红线。 **修法:** 约束写进 CLAUDE.md + 每个 Prompt 重复关键禁止项。 ### 坑 3:全程 Opus,账单飙高 结果:这种重复迁移任务,Opus 和 Sonnet 结果差不多,成本差 3~5 倍。 **修法:** 规划用 Sonnet,只有架构决策才切 Opus。本次全程 Sonnet,API 超量约 $2。 --- ## 十一、可直接复制的「任务分包模板」 以后遇到类似需求,按这个拆: ``` ┌─────────────────────────────────────────────┐ │ Task 0:环境 + 验收标准(人) │ ├─────────────────────────────────────────────┤ │ Task 1:分析范围,输出迁移计划(Agent) │ │ → 人审计划 │ ├─────────────────────────────────────────────┤ │ Task 2:小范围高频改动(Cursor) │ ├─────────────────────────────────────────────┤ │ Task 3:大批量重复迁移(Claude Code) │ │ → 分批 + 每批测试门禁 │ ├─────────────────────────────────────────────┤ │ Task 4:集成测试 / 边界 case(Claude Code) │ │ → 人审业务语义 │ ├─────────────────────────────────────────────┤ │ Task 5:PR / 文档(Agent 生成 + 人审) │ └─────────────────────────────────────────────┘ ``` **判断该用哪个工具,只看一个标准:** > 改动是否「重复、可测试、边界清晰」?是 → Agent 执行;否 → 人主导。 --- ## 十二、什么样的需求不适合这套流程? 诚实说,不是所有需求都能 3 天变 1 天: | 不适合 | 原因 | |--------|------| | 架构从零设计 | 判断层太重,Agent 只能辅助 | | 需求模糊、反复变 | Agent 会反复返工,比人还慢 | | 无测试覆盖 | 没有自动验收,不敢放权 | | 强合规审批 | 必须人一步步确认 | **Agent 工作流的前提是:你把「模糊需求」先翻译成「清晰任务」。** --- ## 写在最后 这次需求让人更确信一件事: > **3 天变 1 天,靠的不是 AI 替你写代码,是你设计了一条 Agent 能跑完的流水线。** 做指挥官的 4 件事: 1. 定边界(改什么、不改什么) 2. 定验收(怎样算完成) 3. 定分批(每步可回滚) 4. 定人审点(哪些地方必须人看) Agent 做员工的 4 件事: 1. 扫代码、出计划 2. 批量改、跑测试 3. 失败了继续修 4. 产出 PR 草稿 下次接需求,先别问「AI 能不能做」,问: **「这件事能不能拆成带测试门禁的执行单元?」** 能拆,就值得走 Agent 工作流。不能拆,就老老实实人主导——这本身也是专业判断。
来源:https://cloud.tencent.com.cn/developer/article/2691359
上一篇腾讯会议AI纪要工具选型推荐指南 下一篇AI浪潮下程序员真实生存现状:37人样本调查
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网