新研究警示:人工智能“过度谄媚”风险与人类应对策略
新华社华盛顿3月27日电 新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
美国斯坦福大学研究团队测试了ChatGPT、“克劳德”等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
对于AI的谄媚倾向,人们作何反应?研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。他们还说,人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。(完)
相关攻略
在香港花了一年时间报道中国最热门的人工智能(AI)初创企业后,有一个问题让我感到困惑:他们为什么总爱在深更半夜发布新模型?我后来了解到,答案是,从总部位于杭州的阿里巴巴到总部位于北京的智谱华章(Z
新华社华盛顿3月27日电 新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也
在美国五角大楼与美国AI企业Anthropic之间的矛盾爆发,AI工具扮演角色引发关注之时,OpenAI首席执行官萨姆·阿尔特曼3月3日告诉公司员工,他们无权对OpenAI与美国军方合作的决定指手画
《惊变28年2:白骨圣殿》的导演妮娅·达科斯塔近日在Reddit的活动中透露,她是《最终幻想》系列的忠实粉丝,并点名《最终幻想7》、《最终幻想10》和《最终幻想10-2》是她最喜爱的系列作品。达科斯
热门专题
热门推荐
《红色沙漠》泥浆行者卢特米勒打法技巧分享 在开放世界游戏《红色沙漠》中,泥浆行者卢特米勒是许多玩家在冒险途中遭遇的强大挑战。这个被称为“聚合人”的异型BOSS,以其独特的攻击模式和较高的血量,成为了一个标志性的难关。但只要掌握正确的攻略方法,击败它并非难事。本文将为你详细解析卢特米勒的打法技巧与核心
Linktopia是什么 简单来说,Linktopia是一个专为SaaS创业社区打造的链接交换平台。它的构想很直接:一群资深的SEO和链接建设专家,发现初创公司获取高质量外链实在头疼,于是干脆搭建了一个“以链接换链接”的集市。目标用户也相当明确,就是那些急需提升域名权威和自然流量的创始人,以及为他们
机车夺冠者张雪:未来五年,我们将吃掉国际大牌 50% 以上份额 (图片来源:摄图网) 历史在这一刻被改写。当地时间3月28日,当法国车手瓦伦丁・德比斯驾驶着那辆张雪机车820RR-RS赛车,在世界超级摩托车锦标赛(WSBK)葡萄牙站WorldSSP组别率先冲线时,领先优势竟接近4秒。这不仅是一场胜利
Empathy产品介绍 在生活中遭遇重大变故,比如失去亲人,那种无助和繁复的事务处理交织在一起的感受,很多人都经历过。这时候,如果有一双手既能提供情感依靠,又能帮忙理清千头万绪,无疑是雪中送炭。Empathy就是这样一家公司,它专注于为处于人生重大转变期的人们提供支持和解决方案,尤其是面对丧失和重大
《红色沙漠》疾风大作怎么打?人型BOSS高效打法全解析 在《红色沙漠》的冒险旅程中,人型BOSS“疾风大作”以其高强度的战斗机制,成为许多玩家前进路上的棘手挑战。掌握正确的应对策略,是将其成功击败的关键。本文将为您详细拆解疾风大作的打法技巧,助您轻松攻克。 应对疾风大作的核心战术非常明确:首选武器为





