研究警示:需警惕人工智能的“过度谄媚”风险
新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
美国斯坦福大学研究团队测试了ChatGPT等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
来源:新华每日电讯
相关攻略
新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。美国斯坦福
近日,人工智能领域国际学术会议NeurIPS(神经信息处理系统大会)在其2026年会议征稿指南中,公然依据美国单边制裁名单,将一批包括中国机构在内的组织排除在投稿范围之外。此举把政治霸权引入学术交流
转载自:minimax开放平台3 月 25 日,minimax 大模型正式接入临港实验室面向生物医药研发打造的科学智能体 geneclaw。临港实验室依托自主研发的元生 origene 智能体与开源
3月25日,2026中关村论坛年会开幕式暨全体会议上,中国工程院院长李晓红发布 "2025全球工程前沿 "。在9个领域共遴选出94个工程研究前沿和95个工程开发前沿,直指未来工程科技发展核心。人工智能与
3月25日消息,今日,国家自然科学基金委员会发布2025年度“中国科学十大进展”。全功能二维半导体 硅基混合架构异质集成闪存芯片、嫦娥六号样品首次揭示月背演化历史和巨型撞击效应等入选。2025年度“
热门专题
热门推荐
可通过五种方式查看悟空浏览器下载记录:一、内置下载管理器;二、系统通知栏跳转;三、“我的”页面入口;四、文件管理器访问默认目录Download wukong;五、全局搜索文件名。如
3月27日消息,有网友晒出他直播的片段,63岁、身家121亿早就财富自由的俞敏洪,居然在直播间里亲自带面膜。两个助理加上自己,手忙脚乱搞了半天,总算把面膜糊上脸了。旁边的小姐姐都憋笑不停,完了俞敏洪
今早,小鹏汽车官宣2026款小鹏MONA M03全面到店并开启试驾。作为品牌10万级纯电轿车的核心走量担当,MONA M03常年稳居细分市场销量前列,这一次改款看点十足。【P1】废话不多说,一起来看
最近的热搜是一个接着一个来,前有罗永浩邀请杨笠上播客被骂,现有瑞士知名鼠标品牌罗技“自砍一刀”。小雷估计大家伙都刷到视频了吧,那配文真的是不堪入目。“当我说我不会再花一分钱时,我一降价,你还不是像狗
3月26日,董明珠在香港科技大学分享会上演讲,本来是聊年轻人怎么帮中国品牌出海,后来现场有同学提问,未来毕业生的年轻人,怎么帮格力和其他中国品牌走向世界。估计是董明珠觉得这次不好回答,于是她把话题拐





