游乐游手机版
首页/科技数码/文章详情

Gemini频现错误:AI新闻摘要准确性再遭质疑

时间:2025-10-24 22:25
2025年10月24日,生成式人工智能在信息整合方面的潜力已得到广泛认可,其所生成的内容时常令人印象深刻。然而,深入审视后不难发现,这项技术在实际应用中仍存在诸多不足。近期,欧洲广播联盟与英国公共广

AI新闻摘要准确性受质疑:Gemini错误率居首

2025年10月24日,生成式人工智能在信息整合方面的潜力已获得广泛认可,其生成的内容时常令人印象深刻。然而经过深入审视后不难发现,这项技术在实际应用中仍存在诸多不足。

近期,欧洲广播联盟与英国公共广播机构联合开展了一项针对主流人工智能系统的评估,重点考察其在新闻摘要生成方面的准确性和可靠性。参与测试的包括ChatGPT、Gemini以及Perplexity等多个备受关注的AI平台。此次研究的背景源于一个值得关注的趋势:目前约有15%的25岁以下人群将人工智能作为获取新闻的主要渠道。

研究初期通过大规模问卷调查及多场专题讨论会,收集公众对AI新闻工具的实际使用反馈与态度。随后,该项目由欧洲广播联盟推动扩展至更广泛的国际层面。结果显示,约42%的英国成年人认为AI生成内容具备准确性,年轻用户群体对该类技术的信任程度更高。但值得注意的是,高达84%的受访者明确表示,一旦发现AI输出存在事实性错误,其信任感将显著下降。因此,关键问题在于:这些系统究竟存在哪些类型的错误,以及用户能否有效识别这些偏差。

评估发现,多数AI系统在生成新闻摘要时均暴露出不同程度的信息失真问题。整体来看,各模型表现水平接近,但Gemini的表现尤为突出——不仅在错误总量上居首,其所产生的严重事实性错误比例也显著高于其他同类系统。

在为期六个月的测试周期中,所有被测AI系统在新闻摘要的准确性方面均呈现不同程度的提升,其中Gemini的改进进度较为明显。尽管如此,其最终表现依然明显落后于其他参与评估的模型。

相关研究结果已整理成文,供公众查阅,主题为人工智能助手新闻真实性。

来源:https://ai.zol.com.cn/1068/10683962.html
上一篇Xbox或要求30%高利润率引发裁员风波 下一篇《战锤6》逃杀模式10.28免费上线,Granite地图前瞻攻略
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
三花智控遭施罗德减持436.17万股
科技数码 · 2026-05-30

三花智控遭施罗德减持436.17万股

5月26日,施罗德在场内减持三花智控四百三十六点一七万股,每股均价三十六点五四三二港元,涉资约一点五九亿港元。持股比例由百分之十四点六三降至百分之十三点七二,机构仓位调整意图值得关注。

vivo S60系列发布 2899元起小屏拍人神器
科技数码 · 2026-05-30

vivo S60系列发布 2899元起小屏拍人神器

2026年5月29日,vivo发布S60系列,含标准版与元气版,全系小屏设计。搭载6 59英寸144HzOLED直屏、7200mAh电池。影像上首发4KLive原相机、地平线OIS防抖及Live调色盘等玩法,支持3D空间视效。标准版配骁龙8s处理器,元气版为天玑7500,起售价2899元。

拉勾网创始人许单单欠32万再被限消成老赖
科技数码 · 2026-05-30

拉勾网创始人许单单欠32万再被限消成老赖

因无力偿还32万余元员工离职补偿款,拉勾网及创始人许单单被法院发布限制消费令。该公司曾估值近2亿美元,现累计被执行超363万元,已申请破产重整。战略决策失误、赛道单一及用户口碑透支导致其陨落。

联想AI主机连发叠加财报超预期股价再创新高
科技数码 · 2026-05-30

联想AI主机连发叠加财报超预期股价再创新高

联想AI主机密集发布叠加财年财报超预期,股价年内翻倍创新高。混合式AI战略落地,AI主机开辟个人AI边缘设备新赛道,降低企业AI使用成本。全年营收831亿美元同比增长20%,净利润同比增长42%,AI收入占比达33%。

莲花Emira 420 Sport登场 轻量化升级 AMG动力极致驾驶
科技数码 · 2026-05-30

莲花Emira 420 Sport登场 轻量化升级 AMG动力极致驾驶

路特斯Emira420Sport中置发动机跑车搭载梅赛德斯-AMG2 0升四缸涡轮增压发动机,通过轻量化减重25公斤、下压力增加25公斤,配合双向可调式减震器与赛道应用程序,实现极致操控性能。欧洲售价十二万九千九百欧元,二零二六年八月交付。