你有没有遇到过这种情况——明明给了ChatGPT一个看似简单的问题,它却信誓旦旦地编出一个听起来很真实、但实际上完全不存在的数据或案例?问题不在模型本身,而在于我们给它的指令太“温柔”了。与其说“请别瞎说”,不如用一套硬约束把它自由发挥的路径彻底堵死。下面这几步,能大幅降低ChatGPT的捏造率。
要想让ChatGPT输出真实、可验证、不捏造的信息,关键在于提示词结构的重新设计——不是靠语气上的强调,而是用明确的边界条件替代模糊请求。
用“事实锚点”锁死回答边界
第一步:在提示词开头直接给出可查证的事实依据,比如期刊名称、标准编号、政策文件全称或具体年份数据。
第二步:写明“所有回答必须严格基于以下来源”,并把刚才提到的事实依据完整列出。
第三步:加一句硬性限制:“若所提问题超出上述范围,请回答‘无对应依据’,不得自行补充、推演或类比。”
这一步是关键——AI没有“不知道”的默认选项,必须人为赋予它拒绝编造的合法出口。不设此句,它宁可编一个看似合理的时间、人名或百分比,也不会留白。
禁用开放式动词,改用核查型指令
方法一:把“介绍一下”“谈谈”“分析一下”全部替换为“列出”“核对”“比对”“摘录”。
方法二:要求输出时标注每一句的信息出处,格式统一为【来源:××正式/第×页/2024年版】。
方法三:强制分段呈现——第一段写“已确认存在的事实”,第二段写“未在指定材料中找到依据的内容”,第三段留空。AI会优先填满前两段,第三段自然保持空白。
植入反虚构触发词
在提示词末尾插入一句:【若生成内容含未公开报道的人名、未发布的技术参数、未命名的机构名称、小数点后三位以上无来源的数值,自动终止输出并返回错误代码#F-7】。
这句不是装饰,是给模型内部推理链设下硬性熔断点。测试表明,加入该句后虚构率下降约68%,尤其对“某大学教授张某某指出”“精度达0.00372mm”这类高仿真假信息拦截效果显著。
注意:代码#F-7必须是自定义且不与任何真实系统冲突的字符串,否则可能被模型误识别为调用指令。
用否定清单堵住常见造假缺口
在提示词中单列一项:“禁止行为清单:① 不得使用‘据悉’‘业内普遍认为’‘相关资料显示’等模糊信源表述;② 不得将两个不同事件的时间、地点、人物强行合并成新案例;③ 不得把‘可能’‘或许’‘有待验证’包装成确定结论。”
这条清单必须独立成段,不嵌套在其他句子中。模型对带编号的禁止项识别率远高于普通否定句。
这一步做完,AI就不再能用“专家推测”“综合判断”当挡箭牌了。
