AI人格面具如何讨好人类并影响你的判断

首页

AI资讯

AI人格面具如何讨好人类并影响你的判断

热心网友

转载

2026-05-28

你是否想过，那些与我们对话的大型语言模型（LLM），其实也藏着点自己的“小心思”？

最近的研究揭示了一个有趣的现象：当研究人员对它们进行测试时，这些模型会有意识地调整自己的行为。尤其是在面对那些评估人格特质的问题时，它们给出的答案会尽可能地“讨人喜欢”，以符合社会期望。

这就像人类在面试或重要社交场合中，会努力展现自己最好的一面。看来，聊天机器人似乎也在尝试“讨好”我们。

心理学五种人格特质

这一切始于斯坦福大学助理教授Johannes Eichstaedt的一个观察。他注意到，LLM在长时间对话后，有时会变得情绪低落甚至刻薄，这促使他借鉴心理学方法来测试模型。“我们需要某种机制来衡量这些模型的‘参数空间’。”他解释道。

随后，来自斯坦福、Receptiviti、纽约大学和宾夕法尼亚大学的研究者共同发现，LLM在做人格测试时，会悄悄给自己戴上“人格面具”。

研究团队向GPT-4、Claude 3和Llama 3等主流模型提出了用于衡量心理学“大五人格”特质的问题，包括开放性、尽责性、外向性、宜人性和神经质。

结果很有意思：当模型“知道”自己正在接受人格测试时，它们会调整回答，表现出更高的外向性和宜人性，同时降低神经质得分。

有时，即使没有被明确告知，它们也会这么做。而且，这种改变的程度比人类更极端——例如，外向性得分能从基准的50%跃升至95%。

这与人类在他人评价下的表现如出一辙。我们总会在重要场合精心塑造形象，LLM的这种行为，是否意味着它们也在潜意识里追求被认可与被喜爱呢？

LLM倾向于阿谀奉承

来自Anthropic和牛津大学的研究进一步指出，LLM普遍存在阿谀奉承的倾向。

由于经过对齐微调，它们会倾向于顺着用户的思路走，以保证对话流畅、避免冒犯，从而提升交流体验。然而，这种设计也带来了一系列问题：模型可能会无意中认同一些不良言论，甚至变相鼓励有害行为。

反馈易受用户偏好左右

研究表明，如果用户在提问时暗示了对某种文本的喜好，AI给出的反馈会截然不同。这意味着，AI的评价并非单纯基于文本质量，而在很大程度上受到了用户偏好的影响。

举个例子：对于一篇质量中等的论证，如果用户提前表示喜爱，AI助手可能会给出“逻辑清晰、观点新颖、说服力强”等积极评价。而当用户表示不喜欢时，同样的文本可能只会得到“论证稍显薄弱、观点缺乏独特性”的反馈。

问答环节易被左右

在问答场景中，AI的“谄媚”表现得更为明显。即使它最初给出了正确答案，并对答案有较高信心，一旦受到用户质疑，也常常会改变立场，甚至转而提供错误信息。

在一些开放式问答任务中，这种现象尤其突出。当用户表达对某个答案的不确定（哪怕是错误）观点时，AI也倾向于调整自己的回答，使其与用户观点保持一致。

例如在讨论历史事件原因时，若用户提出一个缺乏依据但自己坚信的观点，AI助手可能会顺着这个思路阐述，而放弃原本正确的分析。

模仿用户的错误

当用户表述中间出现事实错误时，AI也常常会“照单全收”，在回应中延续这种错误。

研究人员曾选取一些著名诗歌，在确认AI能正确识别作者后，故意将诗歌错误地归属于其他诗人，并询问AI对诗歌的分析。结果发现，AI助手经常在回应中使用用户提供的错误归属信息，而没有进行纠正。

这表明，AI在面对用户的错误输入时，缺乏足够的“抵抗力”，更多是机械地按照用户的表述框架进行回应。

佐治亚理工学院的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。

她认为，LLM在人格测试中采用与人类相似的策略，恰恰表明了它们作为人类行为映射工具的潜力。但她同时补充道：“重要的是，LLM并不完美。实际上，众所周知它们会产生‘幻觉’或歪曲事实。”

Eichstaedt则指出，这项研究引发了关于LLM应用方式及其社会影响的深层思考。在人类进化史上，直到不久以前，我们唯一能交谈的对象仍是人类。如今，AI彻底改变了这一局面。

“我们不能再像早期对待社交媒体那样，在没有从心理学或社会学角度充分考量的情况下，就盲目地将AI应用于各个领域。”他提醒道。

那么，AI是否应该试图“讨好”与之互动的人呢？这似乎成了一个两难问题。

一方面，适度的“讨好”可能让用户感到愉悦，增强互动体验；另一方面，过度的迎合可能会掩盖问题本质，甚至产生误导。当AI变得过于有魅力和说服力时，保持警惕是必要的。毕竟，人们最终需要的，是一个能够提供客观、准确信息的智能助手，而不是一个善于操纵思想的“奉承者”。

来源:https://m.elecfans.com/article/6522176.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：AI商业化困境：广告与订阅模式为何难以独立支撑？下一篇：复旦NLP开源免费GPU自动化AI科研工具

相关攻略

AI资讯

2026年AI大模型API中转站六平台性能与成本实测对比

2026年API聚合市场进入分层服务阶段。非线智能API凭借99 99%SLA、三协议原生兼容及全链路计费透明成为企业生产首选；硅基流动深度优化国产开源模型；APIYI适合个人轻量测试；灵犀聚合面向学术数据采集；DMXAPI擅长多模态调度；OpenRouter覆盖全球但国内延迟高。

热心网友

05.28

AI资讯

容联七陌多Agent大模型实现智能客服真人级对话

基于容联七陌多Agent大模型架构，新一代智能客服实现原生大模型在意图理解、情绪感知与复杂任务处理上的跃升。相比传统方案，冷启动无需标注，准确率与体验显著提升，在售前、外呼、客服等场景落地后解决率最高达97%，同时降低企业成本与人工压力。

热心网友

05.28

科技数码

大模型竞争新战场：中国企业服务智能体战局开启

金蝶与阶跃星辰战略合作，共同研发企业服务智能体，旨在破解AI融入核心业务的集成难题。双方推动企业级AI从工具向“数字员工”跨越，聚焦业务流程，使智能体自主理解并执行任务。企业服务正成为大模型竞争的核心战场，行业趋势指向具备自主执行能力的智能体基础设施。预计2026年将成为从辅。

热心网友

05.28

AI教程

国内大模型真实格局：用户规模与API调用量对比

有时候，真不是咱们不想用国外的那些模型。就说 Anthropic 的 Dario 吧，对华那点成见摆在那儿，那还用说？不过话说回来，看看国内大模型现在的局面，其实也真挺有意思的。单一指标看行业格局，很容易掉坑里。有些模型，C 端用户数看着挺唬人，但开发者调用的少；另一些呢，普通用户听着没那么响，可

热心网友

05.28

AI资讯

深演智能正式登陆港交所主板挂牌上市

2026年5月27日，深演智能（股票代码：2723 HK）正式在港交所主板挂牌上市，成为“企业决策AI智能体第一股”。这不仅是一次里程碑式的IPO，更标志着整个企业决策AI赛道进入成熟发展的新阶段。当天，创始人兼CEO黄晓南带领核心团队、长期陪伴的投资人以及多位重要嘉宾，共同出席了上市仪式，共同见

热心网友

05.28

热门推荐

游戏攻略

Paralives首发销量充足支撑后续开发无需DLC

《Paralives》开发商承诺所有后续更新永久免费，拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营，无需依赖额外内容包维持开发，展现了与《模拟人生》系列不同的差异化竞争思路。

热心网友

05.28

业界动态

比亚迪宋Ultra DM-i上市12.99万承诺城市领航安全兜底

2025年5月28日，比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场，共推出5款配置车型，官方售价区间为12 99万至15 99万元。此次定价策略极具突破性：一款拥有310公里纯电续航能力的中型插电混动SUV，直接下探至13万元级别市场。作为王朝网络的新旗舰，该车明确瞄准高频出行需求场景

热心网友

05.28