来自 Google Research 的一项新研究发现了一个简单却格外有效的提示词技巧:只需把问题复制粘贴再说一遍,就能显著提升大语言模型在非推理任务上的准确率。实验中,Gemini、GPT-4o、Claude 和 DeepSeek 等主流模型的准确率从 21.33% 飙升至 97.33%,最高提升幅度达到 76 个百分点。这个简单的技巧颠覆了以往复杂的提示工程实践,像是“思维链”、“多样本学习”等方法,而且几乎不影响模型生成内容的速度。
研究人员对七个常见基准测试和七种主流大模型进行了对比,他们发现“提示词重复”策略在70组正面测试中赢了47组,可以说表现全优。尤其在需要从长篇大论中精确检索信息的任务上,效果提升非常明显。例如,在“NameIndex”测试中,Gemini 2.0 Flash-Lite 的准确率就从 21.33% 提升到了惊人的 97.33%。
这一现象背后的原理与 Transformer 模型的“因果盲点”有关。这类模型会按照从左到右的顺序处理文本,无法“回头再看”,这导致了信息处理存在天然的缺陷。而“提示词重复”就像是为模型打了一个“补丁”,让第二次阅读获得了类似“上帝视角”的注意力效果,从而能更准确地对齐任务所需的上下文信息。
此外,这项技巧几乎不会增加延迟时间。因为大语言模型在处理信息的预填充阶段具有高度并行性,凭借现代 GPU 的强大算力,即便输入内容翻倍,用户也几乎察觉不到速度上的差异。这意味着开发者无需升级到更庞大、更昂贵的模型,就能实现高准确率的检索和抽取任务。
不过,这种“复读机”策略主要适用于非推理任务,对于那些需要逐步推导逻辑的场景效果有限。在安全方面,重复可能会放大某些指令的显著性,其对越狱成功率的影响尚需专门实验来验证。同时,防护方也可以利用这一机制,通过在系统提示词开头重复安全规则,来增强模型对安全约束的注意力。
