首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
BBC评测:Gemini错误率居首,AI工具新闻总结水平排名

BBC评测:Gemini错误率居首,AI工具新闻总结水平排名

热心网友
88
转载
2025-10-24

10月24日,据外媒Android Authority报道,欧洲广播联盟(EBU)与BBC近日联合评估了ChatGPT、Gemini及Perplexity等多款AI系统在新闻摘要方面的表现。开展这项研究的背景在于,目前约有15%的25岁以下年轻人主要通过AI获取新闻资讯。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

BBC最初通过大规模问卷调查及六场焦点小组访谈,收集公众对AI新闻工具的使用体验与看法,随后EBU将此项研究扩展至国际范围。

研究显示,约42%的英国成年人表示信任AI内容的准确性,而年轻群体的信任度更高。不过,84%的受访者认为,一旦AI系统出现事实性错误,将严重削弱自己对AI的信任。问题的关键在于,这些系统的“不准确度”究竟源于哪些因素,以及用户是否真正察觉到了这些错误。

结果显示,大多数AI生成的内容都存在各种问题。各模型整体表现差距不大,但Gemini成为明显的“异类”——不仅错误数量最多,严重错误的比例也远高于其他系统。

研究进一步指出,Gemini存在的问题主要包括:缺乏清晰的资料来源链接、未能区分可靠信息与讽刺内容、过度依赖维基百科、缺乏足够语境支撑,以及错误引用原文等。

在为期六个月的研究周期中,各大AI系统的表现均有改进,新闻摘要的准确率普遍提升,其中Gemini的进步尤为显著。但即便如此,Gemini的整体表现仍明显落后于其他系统。

来源:https://www.donews.com/news/detail/1/6205332.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌Gemini重塑安卓系统 从操作系统迈向智能平台
科技数码
谷歌Gemini重塑安卓系统 从操作系统迈向智能平台

谷歌将推出GeminiIntelligence,计划将AI深度植入安卓系统,推动其向智能系统转型。新功能聚焦任务自动化,可跨应用理解内容并执行多步骤操作,例如根据邮件生成菜单并添加购物车。该更新将扩展至Chrome、AndroidAuto等平台,覆盖多场景,夏季起从部分旗舰机型开始逐步推广。

热心网友
05.14
谷歌秋季发布首款Gemini原生AI笔记本Googlebook
科技数码
谷歌秋季发布首款Gemini原生AI笔记本Googlebook

谷歌秋季将推出全新AI笔记本Googlebook,首款Gemini原生智能终端。它融合Chromebook与AI能力,搭载专属系统,无缝衔接安卓生态,支持手机应用与跨设备文件访问。核心AI功能包括“魔法指针”智能交互、自然语言生成个性化桌面组件,兼顾轻巧设计与性能平衡。

热心网友
05.13
谷歌发布Googlebook AI笔记本 Gemini模型重塑交互与系统底层
业界动态
谷歌发布Googlebook AI笔记本 Gemini模型重塑交互与系统底层

近日,科技行业迎来标志性事件:谷歌正式发布全新AI笔记本电脑平台Googlebook。这并非一次常规的产品升级,而是预示着个人计算设备的底层架构正发生根本性转变——从以操作系统为中心,转向“以AI模型为核心”。换言之,未来的电脑可能不再需要用户逐一打开应用程序进行操作,而是由一个具备深度理解能力的智

热心网友
05.13
谷歌Gemini智能体正式上线打造你的专属AI助手
AI
谷歌Gemini智能体正式上线打造你的专属AI助手

去年11月,谷歌在发布Gemini 3模型时,同步推出了一项名为“Gemini智能体”的实验性功能,其核心优势在于能够自主处理复杂的多步骤任务。如今,根据最新行业动态以及本周在应用代码中挖掘出的新线索,这项功能似乎即将迎来一次意义重大的全面升级。 首先,让我们了解一下信息背景。我们通常会通过反编译分

热心网友
05.13
谷歌Chromebook将更名为Googlebook并集成Gemini AI
iphone
谷歌Chromebook将更名为Googlebook并集成Gemini AI

据网络泄露信息显示,谷歌可能计划将Chromebook品牌升级为“Googlebook”,并与宏碁、华硕、戴尔等多家OEM厂商合作推出新产品。此次升级的重点在于深度整合GeminiAI,引入可理解屏幕内容的“魔术光标”等智能功能,并加强Android手机的跨平台协同。目前具体细节尚未由官方正式公布

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

马中新能源论坛探讨产业合作与人才培养新路径
科技数码
马中新能源论坛探讨产业合作与人才培养新路径

5月12日,马来西亚吉隆坡成功举办了一场具有前瞻性的行业盛会——中国-马来西亚电动汽车、电池技术与新能源人才创新发展论坛。来自两国政府部门、领军企业、顶尖高校及国际组织的代表共聚一堂,深入交流了在未来产业协同、清洁能源技术创新及高端人才培养等核心领域的合作路径与机遇。 马来西亚第一副总理兼乡村及区域

热心网友
05.14
智元APC香港观察:具身智能如何成为先进生产力单元
科技数码
智元APC香港观察:具身智能如何成为先进生产力单元

具身智能要迈过的第一道硬门槛,从来都是量产。 过去几年,全球人形机器人行业反复印证了这一点:舞台演示可以很快,工程验证可以很快,视频传播也可以很快。但当一台机器人要从实验室走向产线,再走向客户现场,问题的复杂度会呈指数级上升。 特斯拉的Optimus就是一个典型的参照系。马斯克多次表达过对Optim

热心网友
05.14
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号
科技数码
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号

向朋友问路时,如果对方清楚路线,通常会立刻回答“直走然后左转”。但如果对方并不确定,往往会先停顿一下,犹豫地说“呃……好像是……往那边?”。这个开口前的短暂迟疑,往往比最终给出的答案更能说明问题——对方是否真的知道答案。 近期,美国天普大学计算机与信息科学系的一项研究,正是捕捉到了AI回答问题时类似

热心网友
05.14
浙江大学万能分割学习器技术原理与应用场景详解
科技数码
浙江大学万能分割学习器技术原理与应用场景详解

这项由浙江大学、华南理工大学、南京大学和北京大学联合开展的前沿研究,于2026年4月正式发布,其论文预印本编号为arXiv:2604 24575。 图像分割技术听起来或许有些专业,但它早已深度融入我们的日常生活。无论是智能手机拍摄的背景虚化人像、AI系统在CT影像中精准勾勒病灶轮廓,还是自动驾驶汽车

热心网友
05.14
比亚迪大汉纯电续航1000公里对标56E车型参数曝光
科技数码
比亚迪大汉纯电续航1000公里对标56E车型参数曝光

“大唐”预售热潮尚未平息,“大汉”已蓄势待发,比亚迪王朝系列正以前所未有的攻势,叩响高端市场的大门。 在北京车展引发轰动的比亚迪大唐,预售订单已迅速突破10万台大关,彰显了市场对比亚迪高端产品的强烈期待。而最新信息显示,汉家族即将迎来一位重磅新成员——“大汉”,这款定位D级旗舰的轿车,目标直指20-

热心网友
05.14