本次查询:ReAct
中文解释:推理与行动交错框架
常见场景:搜索引擎增强的问答系统 / 复杂任务分解的智能体 / 需要实时校对事实的对话机器人
一句话解释
ReAct让大模型在回答问题时,不是一口气直接输出答案,而是边推理边行动:先想“我该查什么”,然后去执行搜索或调用工具,把结果拿回来再继续推理。就像人类解决难题时一边思考一边动手查资料,而不是闭着眼睛硬猜。
为什么会被关注
传统思维链只关注模型内部推理,但无法验证事实,可能产生幻觉。ReAct通过外部工具(如搜索引擎、计算器)实时获取真实信息,大幅提升事实准确性。
它给了开发者一种可控的“思考-行动-观察”循环范式,让大模型不再是黑盒输出,而是能展示每一步的决策依据和结果反馈。
核心逻辑
ReAct的核心是交替生成“思维轨迹”和“行动步骤”。模型每轮输出一个思考(例如“我需要知道今年的诺贝尔物理学奖得主”),然后生成一个行动(例如调用搜索API),最后把观察结果作为下一轮的输入继续推理。
这种循环天然支持多步决策:模型可以根据前一步搜索结果调整后续提问,直到收集足够信息才给出最终答案。循环次数可由设计者通过上下文长度或最大步数控制。
常见场景
最典型的应用是结合搜索引擎的问答机器人:用户问“最近发布的ChatGPT新功能有什么风险”,模型先搜索相关文章,读取后总结,再对比不同来源。
另一个场景是数据分析助手:模型需要先执行SQL查询,根据返回结果再决定下一步汇总还是可视化。ReAct让这种多工具协作变得自然连贯。
容易混淆的点
有人把ReAct和思维链混淆。思维链只做内部推理,不调用外部工具;ReAct则必须有行动步骤,结果会反馈并改变后续推理。
也有人误以为ReAct必须使用特定API,其实只要模型能输出结构化指令(如JSON格式的动作),任何可编程工具都能接入,比如文件读写、数学计算等。
