麻省理工研究:AI如何缩小信息来源?基于280万条搜索分析
21世纪经济报道记者肖潇报道
近两年间,几乎所有搜索引擎和AI平台都在朝着同一个方向发力:让AI来整合互联网信息。2025年,OpenAI推出ChatGPT搜索功能,与谷歌的AI摘要服务形成竞争;微软随后将Copilot的解决方案整合进Bing;百度与夸克也开始将AI摘要置于页面顶端。
过去人们习惯的关键词搜索模式,正逐渐被AI总结所替代。流量监测机构Statcounter发现,在2024年最后三个月,谷歌的全球搜索市场份额均跌破90%,这是自2015年以来首次跌破九成。这一现象背后传递的信号是:人们获取网络信息的方式正在发生深刻变革。
美国麻省理工学院最新发布了一项研究,对2024至2025年间280万条搜索结果进行了系统分析,试图回答一个问题:AI搜索究竟带来了哪些改变?
研究结论并不乐观。首先是其惊人的扩张速度。
2024年,全球仅有7个国家能够看到谷歌的AI概览功能;一年后,这项服务已覆盖229个国家和地区。研究提到一个更极端的例子:当人们在2024年搜索疫情相关信息时,仅有约1%的查询会返回AI答案;而到2025年,这一比例飙升至68%。可以看出,科技公司的AI内容策略正变得愈发激进。
其次,两个关键指标——引用信源多样性和信源质量,都出现明显下滑。
研究团队分析了280万条谷歌搜索结果数据,发现AI引用的低可信度来源明显更多。以独立新闻评级机构NewsGuard的标准衡量,“低可信”意味着信源通常有传播虚假信息的记录、缺乏纠错机制、不公开所有权信息、存在误导性标题等问题。
与此同时,AI明显偏好超级大站。流量排名前1000的网站贡献了约10%的引用结果,尤其集中在Reddit、维基百科、YouTube等平台。而流量排名1000至100万的长尾网站,比如个人博客和技术论坛,AI的引用量则显著低于传统搜索引擎。
在所有话题上,AI总结的多样性也明显更低。论文解释称,这是因为技术逻辑本身就更倾向于单一声音。大模型需要生成流畅连贯的回答,当它把多个链接压缩为一段话时,容易抹去或忽视存在差异的信源,选择更“平均”的观点。
相比AI答案是否足够可信,更值得担忧的问题是:人们有多愿意相信AI提供的答案?
麻省理工学院的这份研究结果显示,当页面出现AI摘要时,用户的零点击率从60%上升至80%。也就是说,每10个人中就有8人看完AI总结便离开,不再进入原始网页。
即便AI的回答经常存在观点和论据“对不上号”的情况,但只要出现了带参考链接的论据,用户信任度就能显著提升。
研究团队对此表示担忧:过去搜索引擎的设计鼓励用户进行三角验证——打开多个网页、查看作者姓名、留意发布日期,但AI搜索的产品逻辑是快速确认。人们的判断路径在变化,大多数人只在有时间、有足够怀疑精神时,才会被鼓励继续核查。
在这种结构下,判断错误的风险自然被放大。近年的多项独立研究都指出,即便是顶尖大模型,仍存在约30%的陈述缺乏充分支持。我们在2025年对6款国产大模型进行的300次测试中,也发现AI的引用准确率平均只有25%,大约43%的回复提供了无效链接。
另一个可能被忽视的长期影响是,AI搜索对高流量网站的偏好,可能威胁整个信息生态系统的健康。“因为大模型只是整合者,而非生产者。如果那些小众、深度报道等内容创作者的流量下降到不可持续的水平,知识生产的商业模式会面临压力,乃至崩溃。”麻省理工学院的研究提醒道。
当下的问题不是AI搜索是否应该存在(它肯定会在),而是怎样才能将其设计成一个健康可持续的信息系统。
除向用户科普交叉验证、提醒AI不可靠之外,研究向平台和政策制定者提出了几点建议:
比如,AI搜索应该设计为“论文级引用”,方便AI的每一个总结观点都能直接定位到具体来源、具体段落;平台应该遵守多样性配额,尤其是针对医疗健康、公共政策等特定主题,避免依赖单一来源。
最重要的是,AI搜索平台必须公开普及率和影响报告,监管机构同时应当要求平台定期披露“答案引擎透明度报告”。它应当包括带有AI摘要的查询百分比、引用来源的中位数、引用来源的点击率、按类别划分的流量分布,以及内部红队测试中幻觉和错误率的结果。
相关攻略
AI领域的大新闻,总喜欢扎堆出现。就在谷歌I O 2026大会开幕前几小时,OpenAI创始成员、前特斯拉AI负责人Andrej Karpathy宣布加入Anthropic。这无疑为本就白热化的AI竞赛,又添了一把火。而谷歌的回应,来得也相当直接。 过去一年,Anthropic的Claude Cod
谷歌I O开发者大会刚刚结束,Pixel用户便迎来了安卓17 QPR1 Beta 3的实质性更新。此次更新不仅版本号有所推进,更将Material You设计语言深化为更具表现力的“Material 3 Expressive”,为系统界面带来了显著的视觉革新——你的手机正变得更具“毛玻璃”质感。 本
一起不同寻常的诉讼,将科技巨头谷歌推到了风口浪尖。据彭博社报道,美国佛罗里达州一名36岁男子的家属,将谷歌告上了法庭。核心指控是:谷歌旗下的Gemini聊天机器人,被认为诱导了这名男子走向暴力与自残,并最终导致其自杀身亡。 根据本周三在加州圣何塞联邦法院提交的诉状,事情始于一些看似普通的用途。原告乔
3月5日,一则重磅人事变动引发科技行业广泛关注:阿里巴巴集团正式批准了通义实验室核心技术人员林俊旸的离职申请。作为通义千问系列大模型研发的关键负责人,林俊旸的下一步职业动向始终是业界瞩目的焦点。 几乎在同一时间,谷歌旗下的人工智能研究机构DeepMind也公开发声。其开发团队负责人Omar Sans
3月5日,一则来自科技媒体Techradar的报道,在硅谷乃至全球科技伦理领域投下了一枚重磅冲击波。近千名来自谷歌与OpenAI的员工,这两个在人工智能赛道激烈角逐的对手,罕见地联名发表了一封公开信,共同敦促其公司管理层抵制美国军方要求放宽AI使用限制的压力。信中那句“我们绝不分裂”的表态,掷地有声
热门专题
热门推荐
在现代化仓储物流管理中,实现实时、精准的库存可视化是提升运营韧性与效率的核心环节。近日,知名定制化第三方物流服务商Romark Logistics宣布了一项重要技术升级:在其位于哈兹尔顿的仓储基地正式部署由Dexory提供的AI驱动仓储可视化平台DexoryView。此举标志着Romark Logi
今天,谷歌正式将我们带入了一个新的阶段:AI智能体时代。其推出的Gemini Spark,被定义为一款能够全天候运行的个人AI助手。它的核心使命很明确——接管我们日益复杂的数字生活,并实实在在地替我们处理一些工作。 这款助手的“大脑”是最新发布的Gemini 3 5 Flash模型,而协调其行动的“
近日,《自然》杂志同期发表了两项突破性研究,展示了两种旨在革新科研工作流的AI系统。一款来自谷歌,名为Co-Scientist,强调人机深度协作;另一款由非营利机构FutureHouse开发,其系统更进一步,能对特定生物实验数据进行自动化评估与分析。 尽管谷歌表示其系统架构同样适用于物理学探索,但两
谷歌近期对其“氛围编程”平台进行了重要升级。现在,开发者可以直接在谷歌AI Studio中,通过自然语言对话来构建安卓原生应用。 具体操作流程非常直观:用户只需用日常语言描述自己的应用构思,平台内置的安卓模拟器便会实时生成应用预览。若想在实际设备上测试,只需将安卓手机连接至电脑,即可直接安装体验。更
今天,科大讯飞旗下孵化的AI硬件品牌未来智能,正式发布了其创新产品——viaim讯飞智能体耳机。这款产品的核心突破在于,将先进的办公AI Agent能力,集成到一款日常可佩戴的耳机设备中。它不仅超越了传统录音转写功能,更实现了长期记忆存储、多模型灵活调用与智能复盘分析,目标清晰:将耳机从单纯的音频播





