首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
谷歌AI概览准确率仅九成 易受虚假信息误导

谷歌AI概览准确率仅九成 易受虚假信息误导

热心网友
60
转载
2026-05-12

《纽约时报》近期的一篇深度报道,将谷歌AI概览功能推向了舆论的风口浪尖。报道披露,该功能的准确率据称约为90%。这个数字看似令人鼓舞,但考虑到谷歌搜索引擎每年处理的查询量超过5万亿次,其潜在影响便不容小觑。即便仅有10%的误差率,也意味着每小时可能产生超过5700万条不准确信息,平均每分钟接近100万条。如此庞大的错误信息规模,足以引发所有依赖搜索引擎获取准确资讯的用户和专业人士的深度担忧。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

那么,这个90%的准确率数据从何而来?这源于一家名为Oumi的初创公司进行的一项基准测试。他们采用SimpleQA评估框架,对4326次谷歌搜索结果进行了深入分析。数据显示,去年10月,基于Gemini 2模型的AI概览准确率约为85%;而到了今年2月,迭代升级后的Gemini 3模型将这一数字提升至91%,呈现出稳步优化的趋势。

然而,实际情况远比单一数据复杂。首先,Oumi的评估方法本身主要依赖AI工具进行判断,其评估标准可能存在一定的主观性和偏差。其次,谷歌AI概览的一个显著特点是其生成的不确定性:针对同一搜索查询,它可能会产出不同的结果摘要。这种固有的不稳定性,使得“准确率”这一单一指标的参考价值大打折扣。

准确率提升背后:“信源不符”问题日益凸显

更值得关注的是另一个关键趋势。分析表明,AI生成的概览内容与其所引用的原始信息来源之间出现不符的比例正在急剧上升——从Gemini 2时期的37%,大幅攀升至Gemini 3阶段的56%。

这会导致怎样的用户体验困境?用户常常面临两种尴尬场景:要么,看到的AI摘要内容言之凿凿,但点击下方提供的参考链接后却发现原文所述截然不同;要么,摘要得出的结论本身正确,但其用来支撑该结论的引用链接,其内容却是错误的。这就像一个学生在考试中蒙对了答案,但解题过程却引用了错误的公式,其答案的可信度与学习价值自然受到严重质疑。

这种机制上的缺陷,甚至吸引了外界的针对性测试。有媒体记者曾专门发布了一篇包含明显虚假信息的博客文章,结果谷歌的AI概览在次日便引用了该博客作为信源。这一案例清晰地暴露了当前AI概览系统在抵御恶意操纵和甄别信息来源真实性方面,仍存在显著的脆弱性。

内容自相矛盾,持续消耗用户信任

在实际搜索中,令人困惑和矛盾的例子并不少见。例如,用户斯蒂芬・潘瓦西曾搜索传奇摔跤手胡克・霍根是否去世。AI概览明确地告诉他:“目前没有可信报告显示霍根已去世”。然而,就在这条看似安心的摘要下方,搜索引擎结果页却直接展示了一篇标题为“霍根之死谜团加深”的文章链接。

这种页面内部信息的直接冲突,让用户无所适从,不知该相信哪一个。它从根本上动摇了用户对AI生成内容可靠性的信任。当工具自身都无法保证其输出信息的内在同一性时,用户为了核实真相所付出的时间和精力成本反而可能变得更高。

核心问题梳理:

• 规模性风险:在万亿级别的年查询量背景下,90%的准确率意味着绝对数量庞大的潜在错误信息。

• 进步与隐患并存:模型准确率虽在提升,但其产出与信源脱节的比例却不降反升,已超过半数。

• 系统脆弱性凸显:AI摘要易受虚假信息干扰,且存在内容自相矛盾的情况,持续削弱用户信任度。

面对外界的广泛质疑,谷歌的官方回应将焦点引向了评估方法本身。公司发言人对Oumi的测试方式提出了异议,认为此类评估未能全面、真实地反映用户在日常搜索中的复杂行为和实际体验。这场关于“如何科学、公正地衡量AI搜索质量”的辩论与探讨,或许才刚刚拉开序幕。

来源:https://news.aibase.com/zh/news/26931
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

莫氏鸡煲为何开业仅一月就客流锐减无人排队
科技数码
莫氏鸡煲为何开业仅一月就客流锐减无人排队

流量时代的风口,生命周期往往短得惊人,能撑过三个月都算幸运儿。这背后,是注意力经济的残酷法则。 不知道各位还记不记得,一个月前全网刷屏的那家“最不想火的鸡煲店”?当时,老板老莫对着镜头直言味道一般,劝大家别跟风,甚至贴出告示提醒“喝汤可能拉肚子”。结果呢?这股“爱来不来”的桀骜劲儿,反而引爆了网络,

热心网友
05.12
路虎卫士110新款升级 四座布局与外观细节调整解析
科技数码
路虎卫士110新款升级 四座布局与外观细节调整解析

路虎卫士即将迎来第二次重要改款,其测试车谍照近日被外媒清晰捕获。从全新设计的前后保险杠到首次引入的四座独立座椅布局,此次升级旨在全方位提升这款经典硬派SUV的产品力与市场竞争力。 外观方面,新款路虎卫士110的改动颇为显著。前后保险杠均经过重新设计,线条更为立体流畅,与车身整体造型的融合度更高。日间

热心网友
05.12
智谱GLM-5.1模型发布 SWE-bench评分全球领先 价格上调10%
业界动态
智谱GLM-5.1模型发布 SWE-bench评分全球领先 价格上调10%

智谱AI正式发布新一代大模型GLM-5 1。值得注意的是,在新模型发布的同时,模型聚合平台OpenRouter上的数据显示,智谱GLM系列全线模型的价格已悄然上调10%。 此次调价后,GLM-5 1在编程等核心场景的缓存命中Token定价,已基本与Anthropic的Claude 3 5 Sonne

热心网友
05.12
OpenAI首席科学家苏茨克维离职引发管理层震荡
业界动态
OpenAI首席科学家苏茨克维离职引发管理层震荡

近日,人工智能领域传来一则引人关注的消息:被业内誉为“GPT-4o之母”的OpenAI高管乔安妮·张(Joanne Jang)在社交平台正式发文,宣布结束其在公司长达四年半的职业生涯。作为赋予ChatGPT“灵魂”的关键人物,她的离去无疑为这家正冲刺IPO的AI巨头,蒙上了一层新的阴影。 核心人物:

热心网友
05.12
KRAS靶点四十年研究终获突破性进展
科技数码
KRAS靶点四十年研究终获突破性进展

2026年5月6日,国际顶级医学期刊《新英格兰医学杂志》发表的一项重磅研究,为晚期胰腺癌的治疗带来了突破性进展。研究聚焦于一款名为daraxonrasib的创新靶向药,专门用于治疗既往接受过化疗但病情仍持续恶化的晚期胰腺癌患者。数据显示,在26名携带RAS G12突变、接受300毫克剂量作为二线治疗

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

山寨币与主流币的五大核心区别及投资策略
web3.0
山寨币与主流币的五大核心区别及投资策略

主流币与山寨币在市值、技术、共识和风险上差异显著。主流币市值巨大、流动性强,技术经过长期验证,拥有全球共识和明确应用场景,适合长期配置。山寨币则市值小、流动性差,技术基础薄弱且缺乏审计,共识脆弱且多依赖炒作,价格波动剧烈且归零风险高,属于高风险投机标的。

热心网友
05.12
Bitget身份认证攻略:提升证件清晰度与缩短审核时间,快速通过验证
web3.0
Bitget身份认证攻略:提升证件清晰度与缩短审核时间,快速通过验证

进行Bitget身份认证时,除了正确上传照片,证件本身的清晰度至关重要。模糊、反光或信息不全的图片会直接导致审核失败。此外,认证申请提交后的等待时间受平台审核队列、资料完整度及网络状况等多重因素影响,高峰期可能延长。建议用户确保在光线均匀环境下拍摄高清证件照,并耐心等待系统处理,以提升一次性通过率。

热心网友
05.12
Bitget交易所下载全攻略:安卓、iOS与网页端详细安装教程
web3.0
Bitget交易所下载全攻略:安卓、iOS与网页端详细安装教程

本文详细介绍了Bitget交易所在不同设备上的下载与访问方法。安卓用户可通过官方应用商店或APK文件安装,需注意权限设置。iPhone用户需切换至非中国大陆AppStore账户下载官方App。网页端则提供最直接的访问方式,无需安装,但务必核对网址安全性。文章还补充了常见问题与安全建议,帮助用户顺利完成平台使用前的准备工作。

热心网友
05.12
Bitget新手教程:从注册到首笔交易完整指南
web3.0
Bitget新手教程:从注册到首笔交易完整指南

对于初次接触Bitget的新用户,从注册到完成第一笔交易,平台提供了一条清晰的操作路径。关键在于完成账户注册与安全设置,包括身份验证和资金密码。随后,通过法币入金通道为账户注入启动资金,并熟悉现货交易界面的基本操作。最后,在模拟交易中实践后,即可尝试小额真实交易,完成从入门到实操的完整闭环。

热心网友
05.12
Bitget新手入门指南:掌握6个核心页面位置轻松上手交易
web3.0
Bitget新手入门指南:掌握6个核心页面位置轻松上手交易

对于初次接触Bitget这类专业交易平台的新用户来说,感到无从下手是普遍现象。关键在于熟悉核心功能区的布局,特别是资产总览、现货交易、合约交易、资金划转、订单管理和个人设置这六个关键页面。掌握它们的位置和基本逻辑,就能快速理清平台操作脉络,大幅提升使用效率,避免在基础操作上耗费过多时间。

热心网友
05.12