上周有个很典型的场景:企业客户需要一个资料智能整理功能,最好能自动识别重点,还能生成摘要。这话听着简单,但如果直接丢给研发,后续大概率会变成一串连环追问——资料到底是什么格式?重点由谁来定义?摘要给谁看?有没有权限边界?处理失败怎么办?

为了减少在不同工具间来回切换的成本,这次实践把 ChatGPT 5.5 的主流程放在一个多模型聚合环境里运行,偶尔也切换到别的模型去对比同一个输入下的输出差异。本质上,它只是一个统一的模型调用环境,便于保存上下文、对比输出和整理文档。
这不是一篇讨论“AI 能否替代产品经理”的大文章,而是一次更具实操性的复盘:国内开发者或产品团队,如何低门槛借助 ChatGPT 5.5,把一句模糊的需求一步步拆解成可评审、可开发、可测试的交付物。
一开始以为很简单,结果第一版 PRD 直接翻车
最初的输入非常粗糙:
我们要做一个企业资料智能整理功能,请帮我写一份 PRD。它确实很快就给了一份文档,结构也算完整:背景、目标、功能列表、用户流程、风险点都有。但问题也很突出:
- 功能边界过于宽泛,像“自动识别所有重点信息”这种描述,根本没法验收;
- 没有区分 MVP 和后续版本;
- 权限、数据脱敏、上传失败、解析失败这些细节基本缺失;
- 研发看完后依然不清楚接口和数据结构该怎么拆;
- 测试人员也无法从中直接提取测试用例。
这类输出不是“完全没用”,而是停留在一种“看起来完整”的状态。如果直接拿去开评审会,最终还是要靠人来填补那些遗漏的细节。
后来调整了思路:别指望 AI 一次性写出一份完美的 PRD,而是把它当作一个需求拆解助理,让它先抛出问题,再进行整理,最后转化为开发任务。
核心模块一:先让它反问,而不是直接写方案
面对模糊需求,第一步不应该是生成文档,而是把不确定性暴露出来。
一个更有效的做法是让 ChatGPT 先做这件事:
你是一个偏技术背景的产品经理。下面是一句业务需求:
“给企业客户做一个资料智能整理功能,最好能自动识别重点,还能生成摘要。”
请不要直接写 PRD。请先从以下角度列出需要追问业务方的问题:
1. 用户与使用场景
2. 输入资料类型
3. 输出结果形态
4. 权限与数据安全
5. 异常流程
6. 验收标准
7. MVP 范围
要求:
- 每个问题后面说明为什么要问;
- 标出哪些问题如果不确认,会阻塞研发;
- 不要编造业务背景。这次输出的质量明显好得多。它没有着急“给答案”,而是把问题拆成了几大类:
- 资料来源:用户上传、系统同步、邮件附件还是知识库导入;
- 文件类型:PDF、Word、图片、表格、扫描件;
- 摘要对象:给销售看、给法务看、给客服看,还是给管理层看;
- 重点定义:合同金额、时间节点、风险条款、联系人、项目进展;
- 安全要求:是否涉及客户隐私、合同金额、身份证件、医疗或金融信息;
- 失败处理:解析失败、文件过大、格式不支持、权限不足怎么办。
这一步的价值在于,把“看起来简单”的需求转化成了可讨论的问题清单。在实际团队中,这部分可以先发给业务方确认,而不是急着去写长篇的文档。
核心模块二:把确认后的信息压成 MVP,而不是贪多
业务方通常会有很多补充想法:“最好还能识别图片里的文字”“能不能按部门归类”“以后可以接企业微信”“摘要最好支持多语言”。如果全部塞进第一期,研发排期很容易失控。在这一步,可以请 ChatGPT 5.5 帮忙切分 MVP。
示例 Prompt:
下面是业务方确认后的需求信息:
- 用户:企业客户的项目经理和客户成功人员
- 输入:PDF、Word、Excel,暂不支持图片扫描件
- 目标:上传项目资料后,自动生成一页摘要
- 摘要内容:项目名称、客户名称、关键时间、待办事项、风险提示
- 权限:只能查看自己所属项目的资料
- 文件大小:单文件不超过 20MB
- 失败情况:格式不支持、解析失败、权限不足需要明确提示
请帮我拆成:
1. MVP 必做能力
2. 可延后能力
3. 不建议第一期做的能力
4. 每项能力的验收标准
要求:
- 不要使用“智能化”“自动化”等空泛词;
- 每个验收标准都要能被测试人员验证。它给出的结果比手写初稿更加“克制”。比如它把“图片扫描件 OCR”放到了延后,把“跨项目资料汇总分析”放到了不建议第一期,而“生成一页摘要”则被拆分成了字段级验收:
| 功能点 | 验收方式 |
|---|---|
| 上传 PDF、Word、Excel | 上传支持格式文件,系统返回解析状态 |
| 生成摘要 | 摘要必须包含项目名称、客户名称、关键时间、待办事项、风险提示 |
| 权限控制 | A 项目成员不能访问 B 项目资料 |
| 失败提示 | 不支持格式时明确提示“当前不支持该文件类型” |
| 文件大小限制 | 超过 20MB 时阻止上传并给出说明 |
这类表格对研发和测试都更友好,因为它已经把“功能描述”转化成了“可验证行为”。
核心模块三:继续拆接口、状态机和测试用例
到这里还不能直接开工。PRD 有了,但技术层面还需要更细致的拆分。
通常的做法是,继续让 ChatGPT 5.5 生成一个“研发评审辅助版”。注意,不是让它替架构师做决策,而是先把那些可能被遗漏的点列出来。
基于上面的 MVP 范围,请从后端研发视角补充:
1. 可能需要的核心数据表
2. 文件处理状态机
3. 关键接口草案
4. 异步任务与失败重试
5. 需要和产品再次确认的问题
要求:
- 只输出设计草案,不要假设具体技术栈;
- 接口字段只写关键字段;
- 标出哪些地方需要研发进一步评估。最有价值的部分是“状态机”。它会把文件处理拆解成:
UPLOADED(已上传)
VALIDATING(校验中)
PARSING(解析中)
SUMMARIZING(摘要生成中)
SUCCESS(处理完成)
FAILED(处理失败)然后补充每个状态可能对应的失败原因。这对后期的 Bug 排查也很有帮助,因为如果用户反映“资料一直转圈”,研发人员可以首先看它卡在哪个状态,而不是只看到一个笼统的“处理中”。
接下来是生成测试用例:
请基于当前需求生成测试用例,按以下分类输出:
1. 正常流程
2. 文件格式异常
3. 文件大小异常
4. 权限异常
5. 摘要字段缺失
6. 并发上传
7. 异步任务失败重试
每条用例包含:前置条件、操作步骤、预期结果。生成的测试用例不能直接照搬,但它能显著降低测试人员从零开始整理的成本。尤其是异常路径,AI 通常能补出一些容易遗漏的情况,比如:
- 上传成功但解析服务超时;
- 文件解析成功但摘要生成失败;
- 用户上传后被移出项目成员;
- 同名文件重复上传;
- 文件扩展名合法但内容损坏。
这些点不一定都要在第一期全部处理,但至少可以在评审会上提前拿出来讨论。
辅助模块一:同一任务,偶尔换个模型复跑
这篇文章主要围绕 ChatGPT 5.5 展开,但在实际使用中,偶尔会把同一段需求交给其他模型复跑。目的不是评选“谁最强”,而是寻找盲区。
经验表明:
- ChatGPT 5.5 在结构化拆解、任务分层、生成可执行清单方面比较顺手;
- Claude 类模型通常在长文档阅读和语义一致性上占优势,适合检查 PRD 的前后矛盾;
- Gemini 类模型在结合多模态资料时可以补充新的视角;
- Grok 类模型有时能给出更直接的质疑,适合做反向评审。
多模型对比最有价值的场景,不是让它们各自写一篇漂亮的文档,而是让它们互相检查对方可能漏掉的问题。比如可以问:
下面是一份需求拆解结果。请你只做反向评审:
1. 找出不明确、不合理或难以验收的地方;
2. 不要重写全文;
3. 每个问题给出修改建议;
4. 标出优先级。如果三个模型都指出“权限边界不清楚”,那基本可以确认这是一个需要优先回到业务方确认的问题。
辅助模块二:AI 输出应进入评审表,而非直接进入排期
给 AI 生成的内容加一张简单的验收表是很有必要的:
| 检查项 | 是否通过 | 备注 |
|---|---|---|
| 是否有明确用户角色 | ||
| 是否区分 MVP 和后续版本 | ||
| 是否包含异常流程 | ||
| 是否能转成接口或任务 | ||
| 是否能生成测试用例 | ||
| 是否存在编造背景 | ||
| 是否涉及敏感数据 | ||
| 是否需要法务、合规或安全复核 |
这张表看起来简单,但能避免一个常见的陷阱:大家被一份“格式完整”的 AI 文档迷惑,误以为内容也同样完整。尤其是在金融、医疗、政务、教育、合同类需求中,AI 只能辅助整理,不应直接给出最终判断。涉及客户资料、合同、日志、身份信息、医疗信息、交易数据时,输入前必须脱敏;对外输出前,也必须有人承担复核责任。
辅助模块三:适合技术团队的低门槛落地方式
如果团队刚开始接触大模型,不建议一步到位去做复杂的 Agent 或全流程自动化。更稳妥的方式是从几个低风险环节切入:
- 会议纪要转需求问题清单——让 AI 找出不明确的点,而不是直接写最终方案。
- PRD 初稿转研发评审清单——让 AI 从接口、状态、异常、权限等角度补充问题。
- 需求转测试用例草案——重点生成异常路径,再由测试人员筛选。
- 技术文档改写——把口语化说明整理成 Markdown,但关键参数必须人工核对。
- Bug 复盘辅助——输入脱敏后的现象、日志摘要、时间线,让 AI 帮助整理可能的原因和排查顺序。
这些任务的共同特点是:输出易于验证,风险可控,且不需要 AI 直接做最终决策。
一个更稳定的 Prompt 模板
最后,分享一个目前常用的模板,适合产品、研发、测试一起使用:
你现在扮演一个有研发经验的需求分析助手。
背景:
【粘贴业务背景,控制在 500~1000 字】
当前目标:
【说明本次要解决什么问题】
已知约束:
- 用户角色:
- 数据来源:
- 权限边界:
- 上线时间:
- 不做的范围:
请输出:
1. 需求中的不确定问题
2. MVP 功能清单
3. 异常流程
4. 后端需要关注的数据与状态
5. 测试用例分类
6. 需要人工确认的风险点
要求:
- 不编造未提供的信息;
- 对不确定内容用“待确认”标记;
- 所有验收标准必须可测试;
- 涉及隐私、合同、财务、医疗、政务信息时提醒脱敏和人工复核。这个模板并不复杂,但比“帮我写个 PRD”要稳定得多。关键在于,它强制模型承认不确定性。
结尾:把 AI 放在“前置整理”和“反向检查”的位置
经过这次实践,对 ChatGPT 5.5 的定位也更加清晰了:它非常适合把模糊需求拆解成结构化问题,也适合生成 PRD 草案、接口评审点、测试用例和风险清单。但它不应该替业务方定义目标,也不能替研发做最终的架构判断。
对于国内的开发者、产品经理或测试工程师来说,如果想低门槛开始使用大模型,建议先选择一个高频、低风险、可验证的场景:比如需求评审、文档整理、测试用例生成或 Bug 复盘。Prompt 要写清楚边界,输出之后再用人工评审、测试验证和多模型交叉检查来兜底。
AI 最有价值的地方,不是要替代流程中的任何人,而是让那些原本容易被遗漏、重复、耗时费力的环节提前暴露出来。这样一来,开会时少一些“临时发现”,开发时少一些返工,测试也能更早地介入。
