游乐游手机版
首页/科技数码/文章详情

报告称谷歌搜索AI概览准确率约90%

时间:2026-04-14 16:26
谷歌AI概览准确率宣称达90%,但每小时或生成超5700万条错误信息 近期,《纽约时报》披露的一则报道引发广泛关注:谷歌AI概览(AI Overviews)功能的准确率据称约为90%。表面看,九成准确率似乎令人满意,但若结合谷歌每年超过5万亿次的搜索总量进行推算,结果便不容乐观。即便仅有10%的失误

谷歌AI概览准确率宣称达90%,但每小时或生成超5700万条错误信息

近期,《纽约时报》披露的一则报道引发广泛关注:谷歌AI概览(AI Overviews)功能的准确率据称约为90%。表面看,九成准确率似乎令人满意,但若结合谷歌每年超过5万亿次的搜索总量进行推算,结果便不容乐观。即便仅有10%的失误率,这也意味着每小时可能产生超过5700万条错误答案——相当于每分钟接近100万条。这一潜在风险规模,足以引起用户与行业的高度警惕。

第三方测评:准确率虽有提升,但“图文不符”问题恶化

AI初创公司Oumi近期采用SimpleQA基准对谷歌搜索进行了评估。通过对4300余次搜索进行分析,他们发现:去年10月搭载Gemini 2模型的谷歌AI概览准确率约为85%;至今年2月,升级为Gemini 3模型后,该数字提升至91%。模型迭代带来效率进步,固然值得肯定。

例如搜索IT之家,跳出的 AI 概览介绍

然而,评估中有几个关键点值得注意。首先,Oumi的测试本身依赖AI工具,存在一定误差空间。其次,谷歌针对同一搜索查询,有时会提供不同版本的AI概览内容。更值得关注的是,数据显示AI生成的摘要文字与其引用的来源信息之间出现“不一致”的比例正显著上升:该比例已从Gemini 2时期的37%,增至Gemini 3阶段的56%。

所谓“不一致”,通常表现为两种情形:一是AI概括的内容存在错误,但下方提供的参考链接却是正确的;二是概括主体正确,却引用了包含错误细节的网页。这如同导游指对了路线,却讲错了景点典故,难免影响用户的信任感。

内容易遭操纵,且存在页面内“自相矛盾”

更令人担忧的是,研究显示AI概览功能的内容易受人为影响。有记者通过实验发现,故意发布包含虚假信息的博客后,次日谷歌AI概览便引用了该博客内容。这种脆弱性可能为误导性信息的传播提供通道。

普通用户在实际搜索中也可能直接遭遇困惑。例如,用户斯蒂芬·潘瓦西曾查询摔跤手胡克·霍根是否去世,AI概览明确回复“无可信报告显示霍根已去世”,但同一搜索结果页下方却显示文章标题“霍根之死谜团加深”。这种页面内的直接矛盾,让用户对AI生成内容的可靠性产生质疑。

谷歌回应与行业反思

针对Oumi的测试,谷歌发言人指出其方法可能未能反映真实用户搜索场景,这一观点确有合理之处——实验室环境与海量、多元的实际搜索之间存在差异。

尽管如此,前述案例中暴露的具体问题——如摘要与引源脱节、内容易被污染、页面信息矛盾——均是真实存在的用户体验隐患。当AI试图直接为用户归纳答案时,其准确性、一致性与可信度面临更高要求。每小时数千万条潜在错误,虽为理论推算,却清晰提醒我们:在拥抱AI搜索便捷的同时,保持信息审慎与多方验证,仍是当下不可或缺的应对策略。

来源:https://www.163.com/dy/article/KQ03M23K0511B8LM.html
上一篇国产“芯”突破!DF30高性能车规级MCU芯片量产上车进程加速 下一篇小米米家净水器2 Pro双出水1600G开售,到手价2499元
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
全球多地抢滩太空算力,万亿美元市场待挖掘
科技数码 · 2026-06-02

全球多地抢滩太空算力,万亿美元市场待挖掘

多地布局太空算力,北京成立太空智算研究院,天津组建太空数智基础设施联合攻关体,上海启动太空算力产业生态伙伴计划。太空算力可突破地面能耗散热瓶颈,预计2030年全球太空经济规模超万亿美元,正处技术突破与产业布局关键期。

江苏交控携手火山引擎共建高速公路AI能力中心
科技数码 · 2026-06-02

江苏交控携手火山引擎共建高速公路AI能力中心

江苏交控与火山引擎合作建成高速公路AI能力中心,核心产品出行智能体“小茉莉”已上线96777热线、江苏高速APP及茉莉管家小程序,提供7×24小时智能问答服务,成为江苏高速智能化用户服务的关键环节。

比亚迪各品牌5月销量公布海外销售突破16万辆再创新高
科技数码 · 2026-06-02

比亚迪各品牌5月销量公布海外销售突破16万辆再创新高

比亚迪5月总销量三十八万三千四百五十三辆,海外销量十六万零六百四十四辆,再创历史新高。其中王朝与海洋系列三十三万零二百一十五辆,方程豹30186辆,腾势16303辆,仰望286辆。累计新能源汽车销量超1650万辆。

全球首个养猪行业大模型在河南成功落地应用
科技数码 · 2026-06-02

全球首个养猪行业大模型在河南成功落地应用

牧原与阿里云联合打造全球首个养猪行业大模型,覆盖智能育种、环境调控、疾病诊断等环节,实现秒级健康判断。目前已覆盖1173个养殖场,部署超330万套智能设备,每日采集20亿条数据,推动畜牧业数字化转型。

Token经济学重塑全球金融新格局
科技数码 · 2026-06-02

Token经济学重塑全球金融新格局

Token正成为智能时代国际贸易新单元,凝结算力、电力与算法。中国AI模型调用量全球榜首,DeepSeek以极低成本实现规模效应,推动Token出口新模式,将西部绿电转化为数字服务。中美AI形成互补共生格局,规则之争成为新秩序起点。