本系列文章此前探讨了如何借助 RTC 框架让 Agent 精准梳理需求、高情商地拒绝无效请求。今天我们将聚焦于更深层的思考能力——让 Agent 不再局限于“问答机器”的角色,而是能够像人类一样分解问题、探索多条路径,并选出最优解。核心工具正是思维链(Chain-of-Thought)与思维树(Tree of Thoughts)。
读者收益
阅读本文后,你将清晰掌握 CoT 与 ToT 的原理,并学会在 Dify 平台中落地实践,打造一个逻辑严谨、能够多维度审视需求的智能 Agent。
一分钟小知识:CoT 与 ToT
简而言之,CoT 是引导 AI “一步一步思考”,ToT 则是让 AI “设想多种可能性,遇到死胡同就换一条路,选择最优方案前进”。前者属于线性推理,后者则是树状搜索结合自我评估。

1. CoT:思维链(Chain-of-Thought)
核心机制:传统提示方式为“输入 → 输出”,而 CoT 转变为“输入 → 中间推理步骤 → 输出”。它将复杂问题拆解为一连串语言序列,模型在生成最终答案之前,先显式地写出每一步的思考过程。
2. ToT:思维树(Tree of Thoughts)
核心机制:非线性推理 + 评估。ToT 不再局限于单一路径,而是维护一棵“思维树”——每个节点代表一个部分解决方案(Thought),模型可以同时探索多条路径,并对每条路径进行自我评估,判断其“有希望”、“可能可行”或“不可行”。它引入了经典的搜索算法(如广度优先 BFS、深度优先 DFS),使模型能够前瞻(预判某条路径能否通向答案)和回溯(遇到障碍时退回重选)。
Dify 中如何实现
第一部分:思维链对 Agent 思考能力的提升
1. 零样本 CoT(Zero-Shot CoT)
这是最简便的应用方式,无需提供示例。设置方法:只需在 Prompt 末尾添加 Let"s think step by step(让我们一步步思考)。
效果验证
- 我们将
Let's think step by step添加到提示词中; - 输入前文那段杂乱的需求沟通会议纪要;
- 结果:Agent 的思考过程和最终方案都变得清晰可读,相较于未使用 CoT 时效果提升显著。一个带有推演步骤的方案,让人采纳起来更放心。


2. 少样本 CoT(Few-Shot CoT)
适用于有明确思考链路规范的场景,效果通常优于零样本。你需要在 Prompt 中提供 1~5 个完整推理过程的示例,格式为 Question(问题) → Thought(推理过程) → Answer(答案)。
效果验证
- 在提示词中加入范例:
Question → Thought → Answer; - 输入同样的会议纪要;
- Agent 按照参考的 few-shot 格式,一步步分解思考过程。

避坑提示
- 选用参数量大、思考能力强的模型,模型过小可能适得其反;
- 如果没有非常明确的逻辑链路要求,建议优先使用零样本 CoT——样本在规范的同时也会限制 Agent 的创造性思考。
第二部分:思维树如何应用到需求评估
1. 思维分解与路径生成(例如结合 RICE 和 KANO 模型)

2. 注入 Prompt
# Instructions: 运用思维树技术评估每个需求的有效性
Step 1 (Propose): 基于需求描述,生成 3 个考察视角:用户真实痛点、技术实现难度、与现有功能冲突风险。
Step 2 (Evaluate): 对每个视角进行深思熟虑的评估。
• 对于痛点:必须引用用户反馈或数据支持。
• 对于技术:如果涉及未知领域,请标记为“不确定”并建议调用搜索工具。
• 对于冲突:检查是否破坏现有逻辑。
Step 3 (Decision):
• 如果任一视角存在致命缺陷(Fatal Flaw),请直接拒绝需求并说明理由。
• 如果所有视角均通过,请生成 PRD 摘要。
• 如果有疑点,请提出具体问题以供人类澄清(Human-in-the-loop)。
实现效果

可以看到,通过思维树,Agent 具备了深度审视需求的能力——它不再是简单匹配关键词,而是从多个维度反复推敲,给出有理有据的判断。
