BBC评测:Gemini错误率居首,AI工具新闻总结水平排名
10月24日,据外媒Android Authority报道,欧洲广播联盟(EBU)与BBC近日联合评估了ChatGPT、Gemini及Perplexity等多款AI系统在新闻摘要方面的表现。开展这项研究的背景在于,目前约有15%的25岁以下年轻人主要通过AI获取新闻资讯。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
BBC最初通过大规模问卷调查及六场焦点小组访谈,收集公众对AI新闻工具的使用体验与看法,随后EBU将此项研究扩展至国际范围。
研究显示,约42%的英国成年人表示信任AI内容的准确性,而年轻群体的信任度更高。不过,84%的受访者认为,一旦AI系统出现事实性错误,将严重削弱自己对AI的信任。问题的关键在于,这些系统的“不准确度”究竟源于哪些因素,以及用户是否真正察觉到了这些错误。
结果显示,大多数AI生成的内容都存在各种问题。各模型整体表现差距不大,但Gemini成为明显的“异类”——不仅错误数量最多,严重错误的比例也远高于其他系统。
研究进一步指出,Gemini存在的问题主要包括:缺乏清晰的资料来源链接、未能区分可靠信息与讽刺内容、过度依赖维基百科、缺乏足够语境支撑,以及错误引用原文等。
在为期六个月的研究周期中,各大AI系统的表现均有改进,新闻摘要的准确率普遍提升,其中Gemini的进步尤为显著。但即便如此,Gemini的整体表现仍明显落后于其他系统。
相关攻略
谷歌将推出GeminiIntelligence,计划将AI深度植入安卓系统,推动其向智能系统转型。新功能聚焦任务自动化,可跨应用理解内容并执行多步骤操作,例如根据邮件生成菜单并添加购物车。该更新将扩展至Chrome、AndroidAuto等平台,覆盖多场景,夏季起从部分旗舰机型开始逐步推广。
谷歌秋季将推出全新AI笔记本Googlebook,首款Gemini原生智能终端。它融合Chromebook与AI能力,搭载专属系统,无缝衔接安卓生态,支持手机应用与跨设备文件访问。核心AI功能包括“魔法指针”智能交互、自然语言生成个性化桌面组件,兼顾轻巧设计与性能平衡。
近日,科技行业迎来标志性事件:谷歌正式发布全新AI笔记本电脑平台Googlebook。这并非一次常规的产品升级,而是预示着个人计算设备的底层架构正发生根本性转变——从以操作系统为中心,转向“以AI模型为核心”。换言之,未来的电脑可能不再需要用户逐一打开应用程序进行操作,而是由一个具备深度理解能力的智
去年11月,谷歌在发布Gemini 3模型时,同步推出了一项名为“Gemini智能体”的实验性功能,其核心优势在于能够自主处理复杂的多步骤任务。如今,根据最新行业动态以及本周在应用代码中挖掘出的新线索,这项功能似乎即将迎来一次意义重大的全面升级。 首先,让我们了解一下信息背景。我们通常会通过反编译分
据网络泄露信息显示,谷歌可能计划将Chromebook品牌升级为“Googlebook”,并与宏碁、华硕、戴尔等多家OEM厂商合作推出新产品。此次升级的重点在于深度整合GeminiAI,引入可理解屏幕内容的“魔术光标”等智能功能,并加强Android手机的跨平台协同。目前具体细节尚未由官方正式公布
热门专题
热门推荐
5月12日,马来西亚吉隆坡成功举办了一场具有前瞻性的行业盛会——中国-马来西亚电动汽车、电池技术与新能源人才创新发展论坛。来自两国政府部门、领军企业、顶尖高校及国际组织的代表共聚一堂,深入交流了在未来产业协同、清洁能源技术创新及高端人才培养等核心领域的合作路径与机遇。 马来西亚第一副总理兼乡村及区域
具身智能要迈过的第一道硬门槛,从来都是量产。 过去几年,全球人形机器人行业反复印证了这一点:舞台演示可以很快,工程验证可以很快,视频传播也可以很快。但当一台机器人要从实验室走向产线,再走向客户现场,问题的复杂度会呈指数级上升。 特斯拉的Optimus就是一个典型的参照系。马斯克多次表达过对Optim
向朋友问路时,如果对方清楚路线,通常会立刻回答“直走然后左转”。但如果对方并不确定,往往会先停顿一下,犹豫地说“呃……好像是……往那边?”。这个开口前的短暂迟疑,往往比最终给出的答案更能说明问题——对方是否真的知道答案。 近期,美国天普大学计算机与信息科学系的一项研究,正是捕捉到了AI回答问题时类似
这项由浙江大学、华南理工大学、南京大学和北京大学联合开展的前沿研究,于2026年4月正式发布,其论文预印本编号为arXiv:2604 24575。 图像分割技术听起来或许有些专业,但它早已深度融入我们的日常生活。无论是智能手机拍摄的背景虚化人像、AI系统在CT影像中精准勾勒病灶轮廓,还是自动驾驶汽车
“大唐”预售热潮尚未平息,“大汉”已蓄势待发,比亚迪王朝系列正以前所未有的攻势,叩响高端市场的大门。 在北京车展引发轰动的比亚迪大唐,预售订单已迅速突破10万台大关,彰显了市场对比亚迪高端产品的强烈期待。而最新信息显示,汉家族即将迎来一位重磅新成员——“大汉”,这款定位D级旗舰的轿车,目标直指20-





