首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
2024 年 AI 工具测评:谷歌 Gemini 错误率居首,BBC 权威分析

2024 年 AI 工具测评:谷歌 Gemini 错误率居首,BBC 权威分析

热心网友
32
转载
2025-12-05

10月24日消息,生成式AI在信息整理方面确实大有可为,其生成的内容也时常令人惊叹。但只要稍加留意,我们就会发现这项技术仍存在不少缺陷。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据外媒Android Authority今日报道,欧洲广播联盟与BBC近日联合评估了ChatGPT、Gemini及Perplexity等多款AI系统在新闻摘要方面的表现。研究动机在于,目前约有15%的25岁以下年轻人主要通过AI获取新闻。

BBC最初通过大规模问卷调查及六场焦点小组访谈,收集公众对AI新闻工具的使用体验与看法,随后EBU将这项研究扩展至国际范围。

研究显示,约42%的英国成年人表示信任AI内容的准确性,年轻群体的信任度更为突出。不过,84%的受访者认为,一旦出现事实性错误,将会严重削弱自己对AI的信任。问题在于,这些系统的"不准确性"究竟从何而来,以及用户是否真正察觉到了这些错误。

结果显示,大多数AI生成的内容都存在不同程度的问题。各模型整体表现差距不大,但Gemini成为明显"异类",不仅错误数量最多,严重错误的比例也远高于其他系统。

BBC等机构研究评估AI工具新闻总结水平,谷歌Gemini错误比例最高

BBC等机构研究评估AI工具新闻总结水平,谷歌Gemini错误比例最高

研究指出,Gemini的问题主要包括:缺乏清晰的资料来源链接、未能区分可靠信息与讽刺内容、过度依赖维基百科、缺乏足够语境支撑,以及错误引用原文。

在六个月的研究周期中,各大AI系统的表现都有明显改进,新闻摘要的准确率普遍提升,Gemini的进步尤为显著。但即便如此,Gemini的表现仍明显落后于其他系统。

附报告链接:News Integrity in AI Assistants

来源:https://www.ithome.com/0/891/933.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Meta豪赌AI基建!狂砸100亿美元建设得州数据中心,投资规模暴增近6倍
科技数码
Meta豪赌AI基建!狂砸100亿美元建设得州数据中心,投资规模暴增近6倍

Meta加码AI豪赌:得州数据中心投资飙升至逾百亿美元 AI军备竞赛的成本,看来又要刷新认知了。智通财经获悉,Meta Platforms(META US)为其在得克萨斯州埃尔帕索的数据中心项目,开出了超过100亿美元的新账单。这个数字,比最初的预测大幅上扬,也标志着这家社交巨头围绕其人工智能雄心所

热心网友
04.17
科大讯飞学习机全解析:如何挑选适合孩子的智能学习好帮手?
科技数码
科大讯飞学习机全解析:如何挑选适合孩子的智能学习好帮手?

在智能教育快速发展的当下,如何为孩子挑选一款兼具功能性与实用性的学习设备,成为众多家长关注的焦点 作为国内人工智能教育领域的先行者,科大讯飞凭借持续的技术深耕与庞大的教育资源网络,打造了一个覆盖不同学段的学习机产品矩阵,为家庭教育提供了颇具特色的智能化选择。面对市面上琳琅满目的产品,家长们该如何梳理

热心网友
04.17
科大讯飞学习机怎么选?三款热门型号深度测评,助你找到孩子的学习好帮手
科技数码
科大讯飞学习机怎么选?三款热门型号深度测评,助你找到孩子的学习好帮手

随着教育科技的发展,智能学习设备逐渐成为家长为孩子选择学习辅助工具时的热门选项。 没错,现在为孩子挑学习机,真有点像是在科技卖场里做一场精明的投资。科大讯飞,作为国内人工智能领域的排头兵,它的学习机系列凭借过硬的护眼技术和个性化学习路径,确实在家长圈里攒下了不错的口碑。不过,面对琳琅满目的型号,该怎

热心网友
04.17
清华大学突破:让AI学会自己"写操作说明书",比人工编程更聪明?
科技数码
清华大学突破:让AI学会自己"写操作说明书",比人工编程更聪明?

当你买回一台新的智能家电时,最让人头疼的往往不是如何使用它,而是如何让它真正“聪明”起来。 现在,清华大学深圳国际研究生院和哈尔滨工业大学(深圳)的研究团队,给出了一个令人惊喜的答案:让人工智能自己学会写“操作说明书”。这项发表于2026年3月的突破性研究(论文编号arXiv:2603 25723v

热心网友
04.17
【2025链博会】广汽高域苏庆鹏:加码全球产业链协同,以“中国方案”重构低空出行生态
科技数码
【2025链博会】广汽高域苏庆鹏:加码全球产业链协同,以“中国方案”重构低空出行生态

飞行汽车“飞”进展馆:“链主”基因如何驱动产业想象力? 几年前,飞行汽车还只是科幻电影里的常客,象征着对未来天马行空的想象。你猜怎么着?如今,这场景正加速照进现实。航空工业、新能源、人工智能——当这些前沿领域的技术红利开始交汇,一场关于立体出行的变革已悄然启幕。 就在前不久的第三届中国国际供应链促进

热心网友
04.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

追觅宣布进军天文领域 构建“空天地一体化”生态
科技数码
追觅宣布进军天文领域 构建“空天地一体化”生态

“我们的代码,终将写入繁星”:追觅科技成立天文BU,构建从地面到太空的生态闭环 “我们的代码,终将写入繁星。”这句来自追觅科技的宣言,不只是一句诗意的口号,更是一份清晰的战略升级路线图。就在9月10日,这家中国科技企业正式宣告成立天文业务单元(BU),由此完成了一次至关重要的战略跃迁。这标志着其“全

热心网友
04.17
Just Learn
AI
Just Learn

Just Learn是什么 提起用AI为教育赋能,Just Learn这款工具是个绕不开的名字。它由Just Learn公司开发,核心目标非常明确:一手帮教师扩展专业能力,一手为学生打造个性化的学习旅程。说到底,它的价值在于通过AI驱动学习和24 7全天候辅导这两大核心,把教育资源重新“盘活”,让老

热心网友
04.17
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑
前端开发
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑

Vue 渲染机制深度解析:Patch 函数核心逻辑与优化策略 Vue js 的响应式系统实现了数据驱动视图的核心理念。然而,当数据发生变化时,视图是如何被高效且准确地更新的呢?这背后的核心引擎,正是虚拟 DOM 体系中的 Patch 函数。它并非直接操作真实 DOM,而是通过深度比对新旧虚拟节点(V

热心网友
04.17
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作
游戏评测
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作

《空之轨迹SC》完全重制版《空之轨迹 the 2nd》正式定档2026年9月17日,登陆多平台 日本Falcom官方正式公布,经典日式角色扮演游戏《空之轨迹SC》的完全重制版——《空之轨迹 the 2nd》,将于2026年9月17日全球同步发售。本作将登陆任天堂Switch 2、Switch、Pla

热心网友
04.17
AI Art Prompt Generator
AI
AI Art Prompt Generator

AI艺术提示生成器是什么 简单来说,你可以把它理解为一个永不枯竭的创意火花塞。这个基于前沿AI技术的工具,专为破解创作瓶颈而生,无论你是专业画师还是灵感偶尔“罢工”的爱好者,它都能派上用场。它的工作原理并不复杂:依托当前顶级的OpenAI模型,将你的初步想法“催化”成一系列具体、新颖且富有启发性的艺

热心网友
04.17