游乐游手机版

AI 热词解释

首页/AI热词解释/热词详情

Approximate Nearest Neighbor(近似最近邻搜索)

类型:搜索算法 / 数据结构2026-06-01
近似最近邻搜索(ANN)是一种在牺牲少量精度的情况下大幅提升搜索速度的技术,广泛应用于向量数据库、推荐系统、图像检索等需要海量相似性匹配的场景。它让机器不必遍历所有数据就能给出“差不多”的结果。

本次查询:Approximate Nearest Neighbor

中文解释:近似最近邻搜索

常见场景:大规模向量检索与相似度匹配

一句话解释

近似最近邻搜索(ANN)是一种能在海量数据中快速找到与查询项“足够相似”的个体,而不要求绝对精确最近邻的算法。它通过牺牲可接受的精度来换取数量级的速度提升,是处理高维向量检索最有效的通用方案之一。

为什么会被关注

随着大模型和多模态AI的普及,文本、图像、音频都被转化为高维向量(如768维的BERT嵌入)。传统精确最近邻搜索在百万级数据上就需要一次全量遍历,速度完全无法接受。ANN将搜索时间从分钟级压缩到毫秒级,直接支撑起了推荐系统、搜索引擎和向量数据库的实时响应能力。

核心逻辑

ANN的核心思路是“以结构换速度”:通过预先构建索引,把高维空间划分成可快速定位的子区域。常见技术包括:基于树的空间划分(KD-Tree、VP-Tree)、基于哈希的近似映射(LSH将相似向量映射到同一桶)、基于图的小世界导航(HNSW在图中跳跃式搜索)、以及基于量化的编码压缩(PQ将向量拆分为子空间近似)。

常见场景

推荐系统中的“相似物品”召回:用户行为向量在百万商品库中匹配最相似的Top-K物品,ANN将延迟控制在10ms以内。图像/视频指纹检索:比如以图搜图应用,将图片编码成向量后用ANN索引快速找到相同或相似图片。向量数据库(如Milvus、Pinecone、Weaviate)的内核均依赖ANN算法实现毫秒级查询。

容易混淆的点

ANN与精确最近邻(KNN)的区别:KNN要求绝对精确,必须比较全部数据;ANN允许有误差但速度快成百上千倍。二者不是替代关系,而是精度与效率的权衡——若数据量小于10万且需要严格结果,可使用精确搜索;大规模场景下ANN才是实际能用的方案。

来源:AI 热词解释频道整理
上一篇ANN Search 下一篇语义搜索(Semantic Search)到底是什么?

相关热词

继续查看关联概念解释。

最新热词

最近新增和整理过的热词内容。