一、写在前面:GPT-5.5 的提示词逻辑已经变了
如果你还在沿用GPT-4时代那套“ALWAYS + NEVER + 第一步做A、第二步做B”的强流程约束来编写提示词,那么可能需要重新审视了。GPT-5.5不一定表现得更差,但很容易让问题暴露得更彻底——你会被冗余的规则牵着鼻子走。

OpenAI官方在GPT-5.5的提示词指南中明确强调了一个核心转变:“shorter, outcome-first prompts usually work better than process-heavy prompt stacks”。更短、结果导向的提示词,通常比流程堆叠的长提示词效果更好。
原因很简单:GPT-5.5的推理与任务处理能力更强,过度指定流程反而会压缩模型的搜索空间,让输出变得机械。旧模型需要你“教它一步步做”,新模型只需要你“告诉它你要什么”。
下面是我在实际开发中总结的十个提示词技巧,按使用频率从高到低排列。
二、十个提升响应质量的提示词技巧
技巧一:结果先行,拿掉流程
核心原则:不要告诉模型“怎么做”,告诉它“做成什么样算成功”。
GPT-5.5具备Agentic三层推理架构——规划层拆解目标、执行层调用工具、反馈层验证修正,形成闭环。你只需要定义目标,它自己会拆解执行路径。
错误写法:
你先搜索这个产品的资料,然后对比三个竞品,再整理成表格,最后写一篇800字的分析报告。
正确写法:
请帮我评估这款新产品是否值得报道。成功标准:包含核心功能说明、对用户的实际影响、可引用的官方来源、潜在风险提醒。最终用一般读者能看懂的方式输出。
关键差异:错误写法把每一步锁死,模型只能机械执行;正确写法只定义验收标准,模型自主选择最优路径。
技巧二:从最小提示词开始,逐步调优
核心原则:不要直接把旧模型的长提示词“整包搬过来”。
OpenAI官方建议:从一个能保留产品契约的最小提示词开始,然后针对代表性样本逐步调整推理强度、详细度、工具描述和输出格式。
很多过去为了补足旧模型能力不足而设计的流程指令,在GPT-5.5上反而成了干扰。
实操步骤:
- 把旧提示词精简到只剩核心目标和必要约束
- 跑几个代表性样本,看输出质量
- 根据结果逐步增加细节,而不是一开始就堆满
技巧三:用“停止条件”控制输出边界
核心原则:明确告诉模型“什么时候该停”,而不是默认它自己会判断。
GPT-5.5对prompt的理解更字面化——你写得越清楚,它做得越准;你写得含糊,它也会更僵硬。success criteria和stopping rules必须写出来,不能默认“模型自己懂”。
示例:
分析这份用户反馈数据,找出Top 5痛点。当你找到至少5个有明确证据支持的痛点时即可停止,不需要继续挖掘更多。
技巧四:推理强度从低开始,不要默认拉满
核心原则:不要把“推理强度拉高”当成默认优化手段。
GPT-5.5的默认reasoning.effort已改为medium。冲突指令、模糊停止条件、开放工具时,effort加高可能带来过度思考、过度搜索,甚至让输出变差。
实测数据也印证了这一点:有团队在评估中发现,GPT-5.5 high模式成本更高但表现反而比medium更差。
建议:
- 简单任务(分类、摘要):用low
- 常规任务(代码生成、文档撰写):用medium(默认)
- 复杂任务(架构设计、多步推理):用high或xhigh
五个推理强度等级:none / low / medium / high / xhigh。简单任务用low可节省40%-70%成本。
技巧五:把个性(Personality)和协作风格(Collaboration Style)分开写
核心原则:不要混在一起写,分开定义更清晰。
GPT-5.5的默认风格是高效、直接、任务导向。但对于客户对接助手、支持工作流、教练型体验等场景,你需要同时定义两个东西:
- Personality(个性):控制助手听起来怎样——语调、温度、直率程度、正式度、幽默感、共情程度
- Collaboration style(协作风格):控制助手怎么干活——什么时候问问题、什么时候做假设、应该多主动、给多少上下文、什么时候自检
示例:
Personality:专业但不严肃,语气像一位资深同事。
Collaboration style:遇到不明确的信息先提问确认,不要做假设。每完成一个子任务后简要汇报进度。
技巧六:用JSON Schema做结构化输出,而不是靠“软约束”
核心原则:不要只在prompt里写“返回JSON”,要在API层用JSON Schema约束。
很多人以为写一句“只返回JSON”就够了,但这只是软约束——模型大部分时候会听,但偶尔不听,而你不知道它什么时候不听。如果做的是Agent、RAG、自动评分、后台审核这类系统,就不能靠运气。
错误做法:
请分析风险等级,严格返回JSON。
问题:模型可能返回中文枚举值、多返回注释字段、或者JSON解析失败。
正确做法:在API层用JSON Schema明确约束字段、类型、枚举值、必填项。不同平台的API参数名可能不同,不要照抄,要适配自己的接口。
技巧七:多步任务开始前,先发一条简短确认
核心原则:在长时间思考的任务开始前,先发一条用户可见的简短更新。
对于可能花费较长时间思考的多步任务,先返回一句简短的确认信息(1-2句话),表明已收到请求并说明第一步要做什么。
这个技巧能显著改善用户体验——让用户知道模型没有“卡死”,而不是对着空白等待。
示例:
(模型先返回)
“已收到请求,正在分析代码库结构并定位相关模块……”
(然后开始执行实际任务)
技巧八:用“目标 + 约束 + 验证方式”三要素结构
核心原则:每个提示词至少包含这三个要素。
这是Amp团队在实践中验证有效的模式:
示例:
目标:把转录缓存重构为独立模块。
约束:保持公共API不变;性能日志只在特定环境变量下运行;缓存增长需要设上限。
验证方式:运行聚焦测试和类型检查。
这种结构让GPT-5.5既能自主规划路径,又有明确的边界和验收标准。
技巧九:先做规划,再实施——用提示词把内部推理外化
核心原则:在极简推理模式下,把模型的思考过程外化到提示词里。
极简模式下内部推理链被压缩,模型不会像完整推理那样“想清楚再动手”。体现为:规划跳过关键约束、工具选择偏差、多步任务遗漏环节。
规划提示模板:
你是一个任务规划器。收到请求后,按以下步骤输出执行计划:
- 拆分为不超过 {max_steps} 个独立步骤
- 标注并行与串行依赖
- 每个步骤标注所需工具
- 标注可能失败的步骤及备选方案
输出JSON,不输出推理过程。
硬约束步骤数量防止拆得过细或过粗;JSON输出减少解释性token、让下游解析更稳定。
技巧十:在极简模式下加硬性检查规则
核心原则:极简模式下模型倾向于忽略异常信号继续推进,需要在提示词中加硬性检查规则。
极简模式下模型更像按指令执行的工人,提示词里的检查规则越具体,异常场景下的行为越可控。
检查规则模板:
每次工具调用后,先检查:
- 返回状态是否成功
- 数据格式是否符合预期
- 内容是否为空
任何一项不满足时,停止执行,将异常信息返回顶层规划器重新决策。
极简模式适合60%-70%的确定性操作(工具调用、结果解析、格式转换),涉及规划、分支决策、异常判断的步骤需要保留完整推理。
三、总结:GPT-5.5 提示词的三个核心转变
综合以上十个技巧,GPT-5.5的提示词工程相比旧模型有三个根本性转变:
| 维度 | 旧模型(GPT-4时代) | GPT-5.5 |
|---|---|---|
| 指令长度 | 越长越好,细节越多越稳 | 越短越好,只保留目标和约束 |
| 控制方式 | 分步指令(先做A、再做B) | 目标驱动(定义成功标准) |
| 提示词重心 | 教模型“怎么做” | 告诉模型“要做到什么程度” |
记住一条原则:把GPT-5.5当成需要重新校准的新模型,而不是GPT-5.4的机械替换。旧prompt可以先跑基线,但最好不要直接视作最终版本。
当模型能力持续提升,真正的差异将不在于谁写得更细,而在于谁能更清楚地说出:我到底要什么结果。
