21世纪经济报道记者肖潇报道
近两年间,几乎所有搜索引擎和AI平台都在朝着同一个方向发力:让AI来整合互联网信息。2025年,OpenAI推出ChatGPT搜索功能,与谷歌的AI摘要服务形成竞争;微软随后将Copilot的解决方案整合进Bing;百度与夸克也开始将AI摘要置于页面顶端。
过去人们习惯的关键词搜索模式,正逐渐被AI总结所替代。流量监测机构Statcounter发现,在2024年最后三个月,谷歌的全球搜索市场份额均跌破90%,这是自2015年以来首次跌破九成。这一现象背后传递的信号是:人们获取网络信息的方式正在发生深刻变革。
美国麻省理工学院最新发布了一项研究,对2024至2025年间280万条搜索结果进行了系统分析,试图回答一个问题:AI搜索究竟带来了哪些改变?
研究结论并不乐观。首先是其惊人的扩张速度。
2024年,全球仅有7个国家能够看到谷歌的AI概览功能;一年后,这项服务已覆盖229个国家和地区。研究提到一个更极端的例子:当人们在2024年搜索疫情相关信息时,仅有约1%的查询会返回AI答案;而到2025年,这一比例飙升至68%。可以看出,科技公司的AI内容策略正变得愈发激进。
其次,两个关键指标——引用信源多样性和信源质量,都出现明显下滑。
研究团队分析了280万条谷歌搜索结果数据,发现AI引用的低可信度来源明显更多。以独立新闻评级机构NewsGuard的标准衡量,“低可信”意味着信源通常有传播虚假信息的记录、缺乏纠错机制、不公开所有权信息、存在误导性标题等问题。
与此同时,AI明显偏好超级大站。流量排名前1000的网站贡献了约10%的引用结果,尤其集中在Reddit、维基百科、YouTube等平台。而流量排名1000至100万的长尾网站,比如个人博客和技术论坛,AI的引用量则显著低于传统搜索引擎。
在所有话题上,AI总结的多样性也明显更低。论文解释称,这是因为技术逻辑本身就更倾向于单一声音。大模型需要生成流畅连贯的回答,当它把多个链接压缩为一段话时,容易抹去或忽视存在差异的信源,选择更“平均”的观点。
相比AI答案是否足够可信,更值得担忧的问题是:人们有多愿意相信AI提供的答案?
麻省理工学院的这份研究结果显示,当页面出现AI摘要时,用户的零点击率从60%上升至80%。也就是说,每10个人中就有8人看完AI总结便离开,不再进入原始网页。
即便AI的回答经常存在观点和论据“对不上号”的情况,但只要出现了带参考链接的论据,用户信任度就能显著提升。
研究团队对此表示担忧:过去搜索引擎的设计鼓励用户进行三角验证——打开多个网页、查看作者姓名、留意发布日期,但AI搜索的产品逻辑是快速确认。人们的判断路径在变化,大多数人只在有时间、有足够怀疑精神时,才会被鼓励继续核查。
在这种结构下,判断错误的风险自然被放大。近年的多项独立研究都指出,即便是顶尖大模型,仍存在约30%的陈述缺乏充分支持。我们在2025年对6款国产大模型进行的300次测试中,也发现AI的引用准确率平均只有25%,大约43%的回复提供了无效链接。
另一个可能被忽视的长期影响是,AI搜索对高流量网站的偏好,可能威胁整个信息生态系统的健康。“因为大模型只是整合者,而非生产者。如果那些小众、深度报道等内容创作者的流量下降到不可持续的水平,知识生产的商业模式会面临压力,乃至崩溃。”麻省理工学院的研究提醒道。
当下的问题不是AI搜索是否应该存在(它肯定会在),而是怎样才能将其设计成一个健康可持续的信息系统。
除向用户科普交叉验证、提醒AI不可靠之外,研究向平台和政策制定者提出了几点建议:
比如,AI搜索应该设计为“论文级引用”,方便AI的每一个总结观点都能直接定位到具体来源、具体段落;平台应该遵守多样性配额,尤其是针对医疗健康、公共政策等特定主题,避免依赖单一来源。
最重要的是,AI搜索平台必须公开普及率和影响报告,监管机构同时应当要求平台定期披露“答案引擎透明度报告”。它应当包括带有AI摘要的查询百分比、引用来源的中位数、引用来源的点击率、按类别划分的流量分布,以及内部红队测试中幻觉和错误率的结果。
