首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
研究显示AI比人类更自信且善于伪装

研究显示AI比人类更自信且善于伪装

热心网友
60
转载
2026-05-18

如今,向人工智能寻求消费决策、阅读推荐乃至生活各方面的建议,已成为许多人的日常习惯。但一个耐人寻味的现象是:即便AI与人类提供的答案内容完全一致,人们也普遍感觉AI的回应显得更为“笃定”和“自信”。

这一发现源自滑铁卢大学与伦敦大学学院研究团队在《通讯·心理学》期刊上发表的最新研究。他们指出,当人们无法直接评估对方内心的确信程度时,往往会依赖外部可观察的线索——例如回答的速度快慢、做出决策时的流畅程度——来主观推断其信心水平。这种认知偏差,被研究者定义为“自信错觉”。

AI,人工智能,机器人

固有偏见误导信任评估,情感信号缺失暗藏认知风险

这种自信错觉背后,实际上潜藏着两层不容忽视的风险。首先,公众普遍对人工智能在某些专业领域的能力抱有更高期待,这种固有认知偏见很容易导致信任误判。实验结果显示,一旦用户认定某款AI工具“能力强大”,就会下意识地认为它在所有问题上都回答得果断且可靠。然而事实上,面对某些复杂或边缘场景,系统内部可能同样存在不确定性,其生成的答案未必完全可信。

其次,人类在人际沟通中,会自然而然地依赖语调变化、面部表情、肢体语言等情绪信号,来判断对方是否真正自信、以及何时可以采纳其建议。遗憾的是,目前绝大多数大语言模型恰恰缺乏这类情感传达渠道。用户只能进行“盲猜”,其结果是,即便AI自身都“信心不足”,甚至答案存在明显漏洞,用户仍可能过度信赖,从而被引导至错误的方向。

研究探索直观信心传达机制,未来AI或新增“把握度”提示功能

针对这一潜在风险,主导该项研究的科隆巴托教授团队强调,未来的人工智能产品设计必须着力解决此问题——需要通过更直观、更多元化的交互方式,将系统对答案的真实把握程度清晰地“传达”给用户。这不仅是优化当前生成式AI体验的重要方向,更是防止用户因盲目信任而做出错误决定的关键环节。

目前,该团队已着手筹备后续研究,重点探索那些既高效直观、又能建立可靠认知的人机交互传达方式。可以预见,下一代大语言模型很可能会集成一项新功能:实时信心度提示。当AI给出建议或答案时,或许会同步附上一个“置信指数”或“把握度评分”,从而帮助用户更理性、更审慎地判断——这一次,究竟是否应该采纳它的建议。

来源:https://news.aibase.com/zh/news/28087
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Silicon Motion CEO预警:内存与SSD供不应求或持续至2028年
科技数码
Silicon Motion CEO预警:内存与SSD供不应求或持续至2028年

近期,存储芯片行业释放出一个值得高度关注的信号。全球主要SSD主控芯片供应商忆联科技(Silicon Motion)首席执行官发出预警:由于人工智能企业正通过签订长期供货协议并支付预付款的方式,大规模提前锁定核心产能,用于内存(DRAM)与固态硬盘(SSD)的NAND闪存芯片将面临结构性短缺。这场供

热心网友
05.17
Silicon Motion CEO预警:内存与SSD供不应求或持续至2028年
科技数码
Silicon Motion CEO预警:内存与SSD供不应求或持续至2028年

近期,存储行业释放出一个值得高度关注的信号。主控芯片供应商忆联科技(Silicon Motion)的CEO发出预警:由于人工智能企业正通过长期合约和预付款方式锁定大量产能,内存(DRAM)与固态硬盘(SSD)所依赖的NAND闪存将面临持续性短缺。这场供需紧张的拉锯战,很可能将持续至2028年,而相关

热心网友
05.17
合力光辰双引擎服务体系:从SEO到GEO的人工智能搜索新赛道
业界动态
合力光辰双引擎服务体系:从SEO到GEO的人工智能搜索新赛道

当你的潜在客户开始习惯问AI“哪个品牌好”,而不是打开百度搜索关键词时,品牌的战场就已经悄然转移了。没错,传统搜索引擎优化(SEO)依然重要,但在豆包、DeepSeek、文心一言这些生成式AI平台上的“能见度”,正迅速成为决定品牌认知度的新关键。这不再是未来的趋势,而是正在发生的行业变局。 面对这场

热心网友
05.17
大语言模型如何推动人工智能技术发展
业界动态
大语言模型如何推动人工智能技术发展

在探讨人工智能技术时,大语言模型(LLM)无疑是其核心组成部分与关键驱动力。两者之间并非简单的从属关系,而是一种深度融合、相互促进的共生生态。 从技术本质来看,大语言模型是人工智能,特别是深度学习与自然语言处理(NLP)领域发展到高级阶段的标志性成果。其核心原理在于:通过对海量文本数据进行预训练,模

热心网友
05.17
2025年中国人工智能数据总量达199.48EB 同比增长42.86%
AI
2025年中国人工智能数据总量达199.48EB 同比增长42.86%

数据,作为驱动数字经济发展的核心要素,其规模与流向已成为衡量人工智能产业成熟度的关键指标。国家数据局近期发布的权威数据,清晰揭示了2025年中国AI算力市场正在发生的结构性转变。 2025年,我国专门投入人工智能模型训练与推理应用的数据总量攀升至199 48 EB(艾字节),同比增幅高达42 86%

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总
游戏攻略
《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总

《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又

热心网友
05.18
Excel多级分类汇总一句话快速完成
AI
Excel多级分类汇总一句话快速完成

目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值

热心网友
05.18
Kimi K2.6 智能体功能深度解析与体验评测
AI
Kimi K2.6 智能体功能深度解析与体验评测

AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op

热心网友
05.18
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测
AI
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测

彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的

热心网友
05.18
GitHub刷星乱象调查 AI项目成虚假评分重灾区
AI
GitHub刷星乱象调查 AI项目成虚假评分重灾区

GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi

热心网友
05.18