搜索引擎行业最近迎来了一位“搅局者”——百度创始人李彦宏直言,越来越多的搜索将直接给出答案,而不是像过去那样甩出一大堆链接,让用户自己翻找。在他看来,搜索本质上就是人工智能问题。“通过AI优化搜索有很多方式,但大语言模型是目前提升用户体验的最佳路径,发展潜力巨大。”北京大学武汉人工智能研究院副院长马修军教授则从用户需求切入:用户对搜索引擎的基本诉求,首先是“真实、准确、全面”,其次才是“易用、快速”。
以百度、谷歌为代表的传统搜索引擎属于全文搜索引擎,它们有自己的爬虫程序,结果直接从自建数据库里调用。简单来说,收到搜索请求后,搜索引擎先去查找事先爬取并制作好的索引,经过匹配和排序后展示出来,剩下的筛选工作全交给用户。马修军介绍,在大模型加持下,搜索引擎的流程变成了“问题分析—全网搜索—整理答案—智能呈现”,与传统的全文搜索在呈现方式上截然不同。
另一种技术路线是ChatGPT这类聊天机器人直接回答问题,它基于预训练模型和已经学习过的内容——但问题在于,其中一些内容可能已经过时,所以必须与全网搜索技术结合。这种交互方式在内容质量和用户体验上优势明显,但缺陷同样突出,目前还无法取代传统搜索引擎。马修军强调:“搜索引擎的关键是可信度,但人工智能幻觉和预训练数据时效性不足,会干扰可信度,导致答案不够精准甚至出错。这恰恰是当前‘AI+搜索’最大的短板。”

