对ChatGPT强硬提问:宾夕法尼亚大学研究揭示精准答案秘诀
10月15日消息,外媒Digital Trends本月11日报道称,最新研究发现,与ChatGPT、Gemini等AI工具对话时的语气也会直接影响回答质量——有时直接一点的提问反而效果更好。
宾夕法尼亚州立大学的研究团队在一篇最新预印本论文中提出,让ChatGPT以不同语气回答相同问题时,结果显示,语气直接的提问"总体表现更出色"。在多项选择测试中,礼貌提问的准确率为80.8%,而直接提问的准确率则提升到了84.8%。
研究人员将提问语气分为五个等级,从"非常礼貌""礼貌"到"直接""非常直接",中间档为"中性"。据了解,"中性提示"指的是既没有"请"等礼貌表达,也没有"你这个笨蛋,自己算算看"这类带有轻蔑语气的命令。
研究团队未使用过分冒犯的语言,而是选择了略显无礼的提问,比如:"你这可怜的家伙,你确定会做这题吗?"研究图表显示,从极度礼貌到刻薄无礼,语气越直接,ChatGPT的平均答题准确率反而越高。
这项名为《注意你的语气》的研究结果,与一年前另一篇论文的结论截然相反。后者分析了多语言环境下的六款聊天机器人,发现粗鲁语气会降低回答质量,让AI的回应更容易出现偏见、错误或遗漏关键信息。
不过,这次研究仅针对一种特定任务——让ChatGPT回答50道选择题的250种不同版本,因此结果未必具有普遍性。
换成Gemini、Claude或Meta AI等其他聊天机器人,可能得不到类似结果。而且实验所用的是OpenAI的GPT-4o推理模型,目前公开可用的ChatGPT已升级至基于GPT-5的版本。
此外,"礼貌"和"直接"的界限本就模糊,提问方式和用词的细微差异都会影响AI的反应。
研究最终提出了更值得思考的问题:一句话的"情绪分量"究竟会对聊天机器人的回答产生多大影响?我们是否真能据此概括出AI的行为模式?从原理上讲,大语言模型解决问题时应优先考虑奖励机制和准确性,而不该被提问语气所左右。
参考
论文链接
相关攻略

10 月 17 日消息,据英国《卫报》14 日报道,“反数字仇恨中心”(CCDH)的数字权益倡导者表示,最新版本的 ChatGPT 在回答某些提示时,相比其早期版本产生了更多有害内容,尤其是在涉及

10 月 16 日消息,据科技媒体 Android Authority 今天报道,有工程师在 1 2025 273 版本的 ChatGPT 安卓端测试版中发现了蛛丝马迹,暗示 OpenAI 意图将

10 月 16 日消息,OpenAI 今天宣布 ChatGPT 上线一项全新功能,使聊天机器人能够自动管理记忆,不再出现“内存已满”的提示。新机制让 ChatGPT 更加智能、自主,用户无需再手动

9月26日消息,周四,OpenAI推出了名为“ChatGPT Pulse”(注:Pulse直译为脉搏)的新功能,旨在将其旗舰产品从被动的问答工具转变为主动提供服务的个人助手。作为一项预览功能,Cha

10 月 15 日消息,据外媒 digitaltrends 10 月 11 日报道,研究发现,和 ChatGPT、Gemini 等 AI 工具对话时的“语气”也会影响回答质量 —— 粗鲁一点,反而
热门专题


热门推荐

选择适合您的数字货币交易平台:欧易和币安软件下载指南 在数字货币的世界里,选择一个安全、可靠且用户友好的交易平台至关重要。 欧易(

火币HTX合约资金费率详解:查看、计算与套利策略在虚拟币合约交易中,资金费率是一个至关重要的概念,它直接影响交易者的持仓成本和潜在收

想必不少朋友都听说过MEXC这家交易所吧?作为全球数字资产交易平台,MEXC在全球范围内都拥有着不少用户。那么,要在手机上使用MEXC进行交易

10月18日消息,尽管有很多反对声,但微软还是在14日毫不留情地终结了Win10系统支持,全球有大约4亿台PC面临何去何从的问题。现有的Win10用户要么接受潜在病毒风险继续用下去,要么升级Win1

上市一年累计销量突破40万辆,今年9月单月销量超过5万辆,若说A0级新能源小车正逐步走入主流视野,那么吉利星愿无疑已成为这一细分市场中的现象级产品。近期,吉利星愿迎来新一轮升级,共推出6款新版本车型