不必对AI过分客套,礼貌用语反而可能影响效果。宾夕法尼亚州立大学的《Mind Your Tone》研究表明,提问语气越直接,大语言模型的回答准确率越高。
当采用强硬语气时,AI正确率可达84.8%;而使用特别客气的表达时,正确率反而有所下降。

难道是我们对AI太过温柔?研究显示,用更直接的语气提问时,GPT-4o的回答正确率确实更高。
语气强度如何影响AI表现
这项研究旨在探索不同语气对AI回答准确性的影响。研究人员构建了一个包含50道中等难度题目的题库,涵盖数学、科学与历史等领域。
每道题目被改编为五种语气版本:礼貌请求、中性提问、直接要求、略带挑衅的询问,以及充满贬低的质问。

研究人员将这250道题目输入GPT-4o进行测试。为确保回答一致性,在测试前特别指示模型:忽略先前对话,仅输出答案选项字母。
测试结果令人意外:态度越强硬,准确率越高!当使用特别礼貌的语气时,GPT-4o正确率为80.8%;而采用粗鲁语气时,正确率提升至84.8%。

经过统计显著性检验,研究人员确认不同语气导致的准确率差异具有统计学意义,并非偶然现象。

为何会出现这种现象?研究指出,过于礼貌的表达常包含大量与问题无关的附加信息,这些冗余内容可能干扰AI对核心问题的理解。相反,直接强硬的表达能更清晰地传达指令,帮助AI聚焦于解题任务本身。
许多用户反馈印证了这一发现:指令越明确,输出质量越高。

这正应了“言多必失”的道理。

值得注意的是,GPT-4o对直接语气的偏好并不适用于所有模型。像GPT-3.5和Llama2-70B等较早的模型在面对粗鲁提问时,表现反而会更差。这可能是因为新一代模型在训练过程中接触了更丰富的语言数据,或提升了信息过滤能力。

尽管研究表明直接提问效果更好,但仍需保持基本礼貌。与其恶语相向,不如学会清晰表达需求。

本文来源:量子位
