研究发现:提问语气越不客气,AI回答准确率或更高
不必对AI过分客套,礼貌用语反而可能影响效果。宾夕法尼亚州立大学的《Mind Your Tone》研究表明,提问语气越直接,大语言模型的回答准确率越高。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
当采用强硬语气时,AI正确率可达84.8%;而使用特别客气的表达时,正确率反而有所下降。

难道是我们对AI太过温柔?研究显示,用更直接的语气提问时,GPT-4o的回答正确率确实更高。
语气强度如何影响AI表现
这项研究旨在探索不同语气对AI回答准确性的影响。研究人员构建了一个包含50道中等难度题目的题库,涵盖数学、科学与历史等领域。
每道题目被改编为五种语气版本:礼貌请求、中性提问、直接要求、略带挑衅的询问,以及充满贬低的质问。

研究人员将这250道题目输入GPT-4o进行测试。为确保回答一致性,在测试前特别指示模型:忽略先前对话,仅输出答案选项字母。
测试结果令人意外:态度越强硬,准确率越高!当使用特别礼貌的语气时,GPT-4o正确率为80.8%;而采用粗鲁语气时,正确率提升至84.8%。

经过统计显著性检验,研究人员确认不同语气导致的准确率差异具有统计学意义,并非偶然现象。

为何会出现这种现象?研究指出,过于礼貌的表达常包含大量与问题无关的附加信息,这些冗余内容可能干扰AI对核心问题的理解。相反,直接强硬的表达能更清晰地传达指令,帮助AI聚焦于解题任务本身。
许多用户反馈印证了这一发现:指令越明确,输出质量越高。

这正应了“言多必失”的道理。

值得注意的是,GPT-4o对直接语气的偏好并不适用于所有模型。像GPT-3.5和Llama2-70B等较早的模型在面对粗鲁提问时,表现反而会更差。这可能是因为新一代模型在训练过程中接触了更丰富的语言数据,或提升了信息过滤能力。

尽管研究表明直接提问效果更好,但仍需保持基本礼貌。与其恶语相向,不如学会清晰表达需求。

本文来源:量子位
相关攻略
4月5日消息,据“上海交通大学”公众号消息,日前,米哈游联合创始人、总裁、董事长、上海交通大学2005级信息工程专业本科、2009级通信与信息系统专业硕士校友刘伟,代表米哈游创始团队蔡浩宇、罗宇皓,
据彭博社近日报道称,尽管2026年Alphabet、亚马逊、Meta和微软等科技巨头都要投入超过6,500亿美元扩展人工智能(AI),但关键电气元件可用性成为主要障碍,近50%将因电力基础设施短缺和
4月6日消息,最近两年AI发展速度越来越快,AI取代大量工作导致人类失业的说法甚嚣尘上,然而事实可能不是这样。著名风投机构创始人a16z联合创始人Marc Andreessen也是AI圈的大佬,他日
4月6日消息,今日,红果短剧发布《关于持续治理AI短剧素材违规使用行为的公告》(以下简称《公告》)。《公告》显示,今年一季度,平台已累计下架违反平台治理规范的漫剧1718部。其中,针对近期AI短剧素
4月4日消息,发布仅1天的阿里千问新模型Qwen3 6-Plus,冲上全球知名大模型API调用平台OpenRouter的日榜榜首,成为当下最受企业和开发者热捧的大模型。OpenRouter最新数据显
热门专题
热门推荐
清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近
4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配
WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切
聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用
太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行





