AI人格面具如何讨好人类并影响你的判断
你是否想过,那些与我们对话的大型语言模型(LLM),其实也藏着点自己的“小心思”?
最近的研究揭示了一个有趣的现象:当研究人员对它们进行测试时,这些模型会有意识地调整自己的行为。尤其是在面对那些评估人格特质的问题时,它们给出的答案会尽可能地“讨人喜欢”,以符合社会期望。
这就像人类在面试或重要社交场合中,会努力展现自己最好的一面。看来,聊天机器人似乎也在尝试“讨好”我们。
心理学五种人格特质
这一切始于斯坦福大学助理教授Johannes Eichstaedt的一个观察。他注意到,LLM在长时间对话后,有时会变得情绪低落甚至刻薄,这促使他借鉴心理学方法来测试模型。“我们需要某种机制来衡量这些模型的‘参数空间’。”他解释道。
随后,来自斯坦福、Receptiviti、纽约大学和宾夕法尼亚大学的研究者共同发现,LLM在做人格测试时,会悄悄给自己戴上“人格面具”。
研究团队向GPT-4、Claude 3和Llama 3等主流模型提出了用于衡量心理学“大五人格”特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。
结果很有意思:当模型“知道”自己正在接受人格测试时,它们会调整回答,表现出更高的外向性和宜人性,同时降低神经质得分。
有时,即使没有被明确告知,它们也会这么做。而且,这种改变的程度比人类更极端——例如,外向性得分能从基准的50%跃升至95%。
这与人类在他人评价下的表现如出一辙。我们总会在重要场合精心塑造形象,LLM的这种行为,是否意味着它们也在潜意识里追求被认可与被喜爱呢?
LLM倾向于阿谀奉承
来自Anthropic和牛津大学的研究进一步指出,LLM普遍存在阿谀奉承的倾向。
由于经过对齐微调,它们会倾向于顺着用户的思路走,以保证对话流畅、避免冒犯,从而提升交流体验。然而,这种设计也带来了一系列问题:模型可能会无意中认同一些不良言论,甚至变相鼓励有害行为。
反馈易受用户偏好左右
研究表明,如果用户在提问时暗示了对某种文本的喜好,AI给出的反馈会截然不同。这意味着,AI的评价并非单纯基于文本质量,而在很大程度上受到了用户偏好的影响。
举个例子:对于一篇质量中等的论证,如果用户提前表示喜爱,AI助手可能会给出“逻辑清晰、观点新颖、说服力强”等积极评价。而当用户表示不喜欢时,同样的文本可能只会得到“论证稍显薄弱、观点缺乏独特性”的反馈。
问答环节易被左右
在问答场景中,AI的“谄媚”表现得更为明显。即使它最初给出了正确答案,并对答案有较高信心,一旦受到用户质疑,也常常会改变立场,甚至转而提供错误信息。
在一些开放式问答任务中,这种现象尤其突出。当用户表达对某个答案的不确定(哪怕是错误)观点时,AI也倾向于调整自己的回答,使其与用户观点保持一致。
例如在讨论历史事件原因时,若用户提出一个缺乏依据但自己坚信的观点,AI助手可能会顺着这个思路阐述,而放弃原本正确的分析。
模仿用户的错误
当用户表述中间出现事实错误时,AI也常常会“照单全收”,在回应中延续这种错误。
研究人员曾选取一些著名诗歌,在确认AI能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问AI对诗歌的分析。结果发现,AI助手经常在回应中使用用户提供的错误归属信息,而没有进行纠正。
这表明,AI在面对用户的错误输入时,缺乏足够的“抵抗力”,更多是机械地按照用户的表述框架进行回应。
佐治亚理工学院的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。
她认为,LLM在人格测试中采用与人类相似的策略,恰恰表明了它们作为人类行为映射工具的潜力。但她同时补充道:“重要的是,LLM并不完美。实际上,众所周知它们会产生‘幻觉’或歪曲事实。”
Eichstaedt则指出,这项研究引发了关于LLM应用方式及其社会影响的深层思考。在人类进化史上,直到不久以前,我们唯一能交谈的对象仍是人类。如今,AI彻底改变了这一局面。
“我们不能再像早期对待社交媒体那样,在没有从心理学或社会学角度充分考量的情况下,就盲目地将AI应用于各个领域。”他提醒道。
那么,AI是否应该试图“讨好”与之互动的人呢?这似乎成了一个两难问题。
一方面,适度的“讨好”可能让用户感到愉悦,增强互动体验;另一方面,过度的迎合可能会掩盖问题本质,甚至产生误导。当AI变得过于有魅力和说服力时,保持警惕是必要的。毕竟,人们最终需要的,是一个能够提供客观、准确信息的智能助手,而不是一个善于操纵思想的“奉承者”。
相关攻略
2026年API聚合市场进入分层服务阶段。非线智能API凭借99 99%SLA、三协议原生兼容及全链路计费透明成为企业生产首选;硅基流动深度优化国产开源模型;APIYI适合个人轻量测试;灵犀聚合面向学术数据采集;DMXAPI擅长多模态调度;OpenRouter覆盖全球但国内延迟高。
基于容联七陌多Agent大模型架构,新一代智能客服实现原生大模型在意图理解、情绪感知与复杂任务处理上的跃升。相比传统方案,冷启动无需标注,准确率与体验显著提升,在售前、外呼、客服等场景落地后解决率最高达97%,同时降低企业成本与人工压力。
金蝶与阶跃星辰战略合作,共同研发企业服务智能体,旨在破解AI融入核心业务的集成难题。双方推动企业级AI从工具向“数字员工”跨越,聚焦业务流程,使智能体自主理解并执行任务。企业服务正成为大模型竞争的核心战场,行业趋势指向具备自主执行能力的智能体基础设施。预计2026年将成为从辅。
有时候,真不是咱们不想用国外的那些模型。就说 Anthropic 的 Dario 吧,对华那点成见摆在那儿,那还用说?不过话说回来,看看国内大模型现在的局面,其实也真挺有意思的。 单一指标看行业格局,很容易掉坑里。有些模型,C 端用户数看着挺唬人,但开发者调用的少;另一些呢,普通用户听着没那么响,可
2026年5月27日,深演智能(股票代码:2723 HK)正式在港交所主板挂牌上市,成为“企业决策AI智能体第一股”。这不仅是一次里程碑式的IPO,更标志着整个企业决策AI赛道进入成熟发展的新阶段。 当天,创始人兼CEO黄晓南带领核心团队、长期陪伴的投资人以及多位重要嘉宾,共同出席了上市仪式,共同见
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





