报告称谷歌搜索AI概览准确率约90%
谷歌AI概览准确率宣称达90%,但每小时或生成超5700万条错误信息
近期,《纽约时报》披露的一则报道引发广泛关注:谷歌AI概览(AI Overviews)功能的准确率据称约为90%。表面看,九成准确率似乎令人满意,但若结合谷歌每年超过5万亿次的搜索总量进行推算,结果便不容乐观。即便仅有10%的失误率,这也意味着每小时可能产生超过5700万条错误答案——相当于每分钟接近100万条。这一潜在风险规模,足以引起用户与行业的高度警惕。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
第三方测评:准确率虽有提升,但“图文不符”问题恶化
AI初创公司Oumi近期采用SimpleQA基准对谷歌搜索进行了评估。通过对4300余次搜索进行分析,他们发现:去年10月搭载Gemini 2模型的谷歌AI概览准确率约为85%;至今年2月,升级为Gemini 3模型后,该数字提升至91%。模型迭代带来效率进步,固然值得肯定。

例如搜索IT之家,跳出的 AI 概览介绍
然而,评估中有几个关键点值得注意。首先,Oumi的测试本身依赖AI工具,存在一定误差空间。其次,谷歌针对同一搜索查询,有时会提供不同版本的AI概览内容。更值得关注的是,数据显示AI生成的摘要文字与其引用的来源信息之间出现“不一致”的比例正显著上升:该比例已从Gemini 2时期的37%,增至Gemini 3阶段的56%。
所谓“不一致”,通常表现为两种情形:一是AI概括的内容存在错误,但下方提供的参考链接却是正确的;二是概括主体正确,却引用了包含错误细节的网页。这如同导游指对了路线,却讲错了景点典故,难免影响用户的信任感。
内容易遭操纵,且存在页面内“自相矛盾”
更令人担忧的是,研究显示AI概览功能的内容易受人为影响。有记者通过实验发现,故意发布包含虚假信息的博客后,次日谷歌AI概览便引用了该博客内容。这种脆弱性可能为误导性信息的传播提供通道。
普通用户在实际搜索中也可能直接遭遇困惑。例如,用户斯蒂芬·潘瓦西曾查询摔跤手胡克·霍根是否去世,AI概览明确回复“无可信报告显示霍根已去世”,但同一搜索结果页下方却显示文章标题“霍根之死谜团加深”。这种页面内的直接矛盾,让用户对AI生成内容的可靠性产生质疑。
谷歌回应与行业反思
针对Oumi的测试,谷歌发言人指出其方法可能未能反映真实用户搜索场景,这一观点确有合理之处——实验室环境与海量、多元的实际搜索之间存在差异。
尽管如此,前述案例中暴露的具体问题——如摘要与引源脱节、内容易被污染、页面信息矛盾——均是真实存在的用户体验隐患。当AI试图直接为用户归纳答案时,其准确性、一致性与可信度面临更高要求。每小时数千万条潜在错误,虽为理论推算,却清晰提醒我们:在拥抱AI搜索便捷的同时,保持信息审慎与多方验证,仍是当下不可或缺的应对策略。
相关攻略
谷歌AI概览准确率宣称达90%,但每小时或生成超5700万条错误信息 近期,《纽约时报》披露的一则报道引发广泛关注:谷歌AI概览(AI Overviews)功能的准确率据称约为90%。表面看,九成准确率似乎令人满意,但若结合谷歌每年超过5万亿次的搜索总量进行推算,结果便不容乐观。即便仅有10%的失误
新华社北京1月13日电 记者手记:让好奇心带路——聆听诺奖得主保罗·纳斯的访华演讲 新华社记者胡喆 “何为生命?”这是新年开启又一次访华之旅的诺贝尔奖得主保罗·纳斯为来自中国科学院大学、北京
热门专题
热门推荐
Lemonaid是什么 如果你正为音乐创作寻找得力助手,那么Lemonaid很可能就是答案。它是一款专门面向专业音乐人打造的AI音乐生成工具,核心能力在于自主生成包含完整旋律、和声与节奏的乐曲。无论是想要一段氛围感十足的背景音乐,还是为具体场景定制配乐,它都能提供高度逼真且质量上乘的作品。工具提供了
苹果也要出折叠屏,传闻已经有几年了,从目前供应链、分析师与知名爆料者释放的信息来看,这款与市面大折都不一样的阔折叠似乎已经蓄势待发,大概率今年下半年就要正式面市。今天我们就来为大家汇总一波,没准儿就有你想知道的消息。 关于苹果折叠屏手机的传闻,已经流传了好几年。如今,综合供应链、分析师以及各路知名爆
《刺客信条:黑旗重制版》官宣之际,这款新海盗游戏为何能抢先赢得玩家口碑? 当游戏界的焦点都集中在《刺客信条:黑旗重制版》的正式公布时,一款名为《风启之旅》(Windrose)的开放世界海盗生存建造游戏,却凭借其过硬的品质与独特的玩法融合,悄然在玩家社区中掀起热议。这款由乌兹别克斯坦团队Kraken
产品介绍 提到云端智能视频创作,腾讯智影是一个绕不开的名字。这款由腾讯推出的平台,本质上是一个一站式的在线视频工厂,集成了从素材挖掘、剪辑、渲染到最终发布的全链路功能,旨在为用户提供全方位的视频创作解决方案。更吸引人的是,它不仅免费开放,还深度整合了多项前沿AI技术,目标很明确:让视频化表达这件事,
《王者荣耀世界》线下活动风波:合影互动引争议,职业素养与网络舆论深度探讨 近日,《王者荣耀世界》的一场线下玩家见面会,因台上一次短暂的合影互动,意外成为全网热议的焦点。活动中,一位男粉丝上台与角色扮演者(Coser)合影时,主动做出比心手势以示友好,却未得到身旁Coser的任何回应。男生举着手势在原





