首页 游戏 软件 资讯 排行榜 专题
首页
AI
国际研究警示:45%的AI生成新闻存重大事实偏差

国际研究警示:45%的AI生成新闻存重大事实偏差

热心网友
99
转载
2025-10-28

10月27日消息,欧洲广播联盟(EBU)与英国广播公司(BBC)共同主导的最新研究揭示,如今作为数百万人日常信息来源的人工智能助手,无论是使用哪种语言、身处哪个地区,或是在哪个AI平台上进行测试,经常歪曲新闻事实。

国际研究:AI 助手常歪曲新闻内容,45% 回答存重大问题

这项规模空前、覆盖范围最广的国际调研在EBU新闻大会上发布。来自18个国家、使用14种语言的22家公共媒体机构(PSM)参与了这项研究,揭示了四款主流AI工具存在的多项系统性问题。

据了解,各参与媒体的专业记者依据准确性、信息来源标注、事实与观点区分以及背景信息提供等关键标准,评估了ChatGPT、Copilot、Gemini和Perplexity生成的超过3000条回复内容。

主要研究发现包括:

所有人工智能回复中,有45%存在至少一个重大问题。

31%的回复存在严重的信息来源问题,包括缺失、误导或错误引用来源。

20%的回复存在重大准确性问题,包括虚构细节和过时信息。

Gemini的表现最不理想,其76%的回复存在显著问题,是其他AI助手的两倍以上,主要归因于其糟糕的信息溯源能力。

与BBC今年早些时候的研究结果相比,部分AI工具有所改进,但错误率仍处于高位。

人工智能助手正逐渐取代搜索引擎,成为用户获取信息的首选渠道。根据路透社新闻研究所的《2025年数字新闻报告》,全球有7%的在线新闻消费者通过AI助手获取新闻,而在25岁以下人群中,这一比例高达15%。

EBU媒体总监兼副执行干事让·菲利普·德滕德尔(Jean Philip De Tender)表示:“这项研究清楚表明,这些问题并非孤立事件,而是具有系统性、跨国界和多语种特征。我们认为,这正在危及公众对媒体的信任。当人们无法判断什么值得信赖时,最终可能什么都不再相信,而这将削弱民主社会的参与基础。”

BBC生成式人工智能项目总监彼得·阿彻(Peter Archer)指出:“我们对AI充满期待,相信它能帮助我们为受众创造更多价值。但前提是,人们必须能够信任他们所阅读、观看和接触的内容。尽管已有一定改善,但这些AI助手仍存在显著问题。我们希望这些技术能够成功,并愿意与AI企业合作,共同为受众和社会创造积极影响。”

研究团队同时发布了《AI助手新闻完整性工具包》(News Integrity in AI Assistants Toolkit),旨在为研究报告中揭示的问题提供实用解决方案。该工具包涵盖提升AI助手回应质量及增强用户媒介素养两个方面。基于本次研究中收集的大量案例与洞察,工具包聚焦两大核心问题:“什么样的AI助手回应才算优质?”以及“哪些问题亟需修复?”

此外,EBU及其成员机构正敦促欧盟及各监管机构严格执行有关信息真实性、数字服务法规和媒体多元化的现行法律。鉴于AI技术发展迅猛,持续开展独立监测至关重要。为此,EBU正在探索建立常态化、滚动式的研究机制,以长期跟踪AI助手的表现。

本次研究建立在BBC于2025年2月发布的初步研究基础之上,当时的研究首次揭示了AI在处理新闻内容方面的严重缺陷。此次第二阶段研究将范围扩展至全球,进一步证实了此类问题具有普遍性,而并非局限于特定语言、市场或某款AI助手。

另据BBC同日发布的补充研究显示,公众对AI助手用于新闻的使用习惯与认知也令人担忧:目前已有超过三分之一的英国成年人相信AI生成的新闻摘要具备准确性,而在35岁以下人群中,这一比例接近一半。

这些发现引发了深刻关切:许多人误以为AI生成的新闻摘要准确可靠,但事实并非如此;当他们发现错误时,往往会同时责怪新闻机构和AI开发者——即便错误完全由AI助手造成。长此以往,这类问题可能严重损害公众对新闻本身及其品牌的信任。

来源:https://www.ithome.com/0/892/544.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌Gemini官网入口及人工智能平台介绍
业界动态
谷歌Gemini官网入口及人工智能平台介绍

想要亲身体验近期备受瞩目的Gemini AI吗?特别是其3 0 Pro版本上线后,许多用户都渴望了解它的真实能力。那么,它的官方网站入口到底在哪里?如何顺利访问呢? Gemini人工智能官网入口地址 最权威的官方访问地址是:https: gemini google com。 然而,访问前有两点至关

热心网友
05.17
Gemini人工智能是哪个国家开发的
业界动态
Gemini人工智能是哪个国家开发的

Gemini 人工智能的归属 谈到当今最受瞩目的人工智能模型,谷歌的Gemini无疑是核心玩家之一。这款AI并非凭空出现,它根植于谷歌深厚的技术土壤,是其整体AI战略的支柱。具体来说,Gemini由谷歌公司主导开发,而关键的研发工作则由整合了传奇AI研究机构DeepMind团队的Google Dee

热心网友
05.17
超级人工智能AGI的定义与未来发展趋势解析
业界动态
超级人工智能AGI的定义与未来发展趋势解析

在探讨人工智能的演进方向时,“超级人工智能”无疑是终极愿景与核心议题。它不仅是科幻想象的热点,更是当前技术发展轨迹上明确的前沿目标。究竟什么是超级人工智能?它又将如何改变我们的世界? 一、什么是超级人工智能 超级人工智能,英文通常称为Super Artificial Intelligence,简称S

热心网友
05.17
嵌入式AI大模型是什么及其应用场景解析
业界动态
嵌入式AI大模型是什么及其应用场景解析

当我们探讨下一代智能设备的发展方向时,一个核心趋势日益凸显:人工智能正从云端“下沉”,直接部署到我们日常使用的终端设备中。这种融合了嵌入式系统与人工智能大模型的技术,不仅赋予设备强大的本地数据处理与分析能力,更关键的是,它实现了无需依赖云端数据中心的实时决策与智能响应。这不仅是技术路径的迁移,更是智

热心网友
05.17
人工智能Agent的本质解析:能力构成与核心应用场景
业界动态
人工智能Agent的本质解析:能力构成与核心应用场景

想象一下这样的场景:深夜的办公室里,营销总监正对着一份过时的竞品分析报告发愁。这份报告需要手动从十个不同平台收集数据,等她终于整理完,市场热点早已过去。而与此同时,隔壁公司的AI智能体刚刚自动生成了包含实时数据、趋势预测和行动建议的完整洞察报告,并且已经启动了第一轮广告投放测试。 这种效率上的巨大反

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里AI生态全景解析:从夸克到通义千问的流量入口布局与未来展望
AI
阿里AI生态全景解析:从夸克到通义千问的流量入口布局与未来展望

如果你发现阿里系AI应用近期密集上线、品牌标识迅速统一、生态能力集中释放,这并非偶然——背后是一场精心布局的战略升级。阿里正在全面重构其AI时代的流量入口体系,具体正沿着以下几条关键路径加速推进。 一、品牌体系收束:从多头并进到千问单极 过去,阿里在AI产品线上采取分散布局:夸克侧重智能搜索,灵光聚

热心网友
05.17
UiPath中国名称是什么?五大国产RPA替代软件推荐
业界动态
UiPath中国名称是什么?五大国产RPA替代软件推荐

2023年初,一家欧洲奢侈品牌的中国区数字化负责人,收到了一份令人尴尬的年度审计报告。在“业务流程自动化覆盖率”这项关键指标上,中国区在全球各分公司的排名中,位列倒数第三。总部力推的UiPath平台,在中国团队的实际使用率竟不足30%。报告一针见血地指出,问题并非出在态度上,而是源于“工具与土壤的错

热心网友
05.17
Excel跨表提取整行数据的实用方法与步骤详解
业界动态
Excel跨表提取整行数据的实用方法与步骤详解

在Excel数据分析与报表制作中,跨工作表提取整行信息是一项常见且关键的操作。无论是进行多表数据整合、制作动态查询看板,还是完成日常数据核对,掌握高效的跨表提取技巧都能显著提升工作效率。本文将系统介绍六种实用方法,涵盖从基础函数到自动化工具的多种场景,帮助您根据数据结构和任务复杂度灵活选择最佳方案。

热心网友
05.17
小红书数据采集工具哪个好?免费采集软件推荐与使用指南
业界动态
小红书数据采集工具哪个好?免费采集软件推荐与使用指南

在小红书运营和内容创作中,分析爆款笔记、借鉴优质同行文案是提升账号表现的关键。然而,手动逐个点开笔记查看不仅耗时耗力,效率也难以保证。市面上虽然存在不少数据采集工具,但许多都需要付费订阅。实际上,也有免费且功能强大的替代方案,例如“实在Agent”平台推出的小红书采集智能体。它集成了热门笔记采集分析

热心网友
05.17
实在智能RPA财务机器人价格解析与选购全攻略
业界动态
实在智能RPA财务机器人价格解析与选购全攻略

在探讨实在智能RPA财务机器人的市场价格时,许多企业会发现其报价并非固定数值,而是呈现出从数千元到数十万元不等的宽幅区间。这种价格差异的背后,实际上是品牌实力、功能配置、性能水平、服务支持以及企业具体需求等多重因素共同作用的结果。 要清晰理解实在智能RPA财务机器人的定价逻辑,我们可以从以下几个核心

热心网友
05.17