快手CroPS检索数据引擎入选AAAI 2026亮点解读
短视频搜索是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的“自强化”训练模式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。针对当前挑战,快手搜索团队提出了CroPS框架,从根源上打破数据闭环。目前,CroPS已在快手搜索业务中实现全量部署,服务亿级用户。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
本工作相关成果《CroPS: 通过跨视角正样本改进短视频搜索中的稠密检索》已被人工智能顶级会议AAAI 2026接收为口头报告。

在真实的搜索场景中,用户往往难以一次性精准表达意图。当用户输入查询词A却未能找到满意结果时,通常会进行查询重构,输入语义相关但表述不同的查询词B。CroPS通过分析用户在短时间内窗口内的改写序列,将改写后获得的成功点击回流给原始查询,利用用户的修正行为来纠正模型的语义偏差。
推荐系统拥有海量用户消费数据,其算法机制天然倾向于发散和探索。CroPS建立了一套跨系统的信号衔接机制:对于同一个用户,如果他在推荐信息流中深度消费了某个视频,且该视频在语义上与用户近期的搜索词高度相关,该视频就会被引入作为搜索模型的正样本。
当平台现有的内容库或日志无法覆盖某些长尾、复杂查询时,CroPS引入大语言模型(LLM)作为虚拟检索引索器和内容生成器,利用One-shot Prompting策略生成高质量合成样本,将外部世界的常识与逻辑蒸馏进检索模型中。
在多源正样本被引入之后,如何让模型有效利用这些信号,同样成为训练阶段的关键。HLA的核心是解决CroPS多源正样本的可靠性差异问题,通过为样本分配分层标签,让模型能够学习更细粒度的相关性。H-InfoNCE在训练时,将当前样本与标签严格低于它的所有样本进行对比,使学习目标与HLA的层级逻辑完全对齐。
这一系列设计共同构成了CroPS在工业检索场景中的完整解决方案。CroPS证明了在工业检索系统中,正样本增强是缓解信息茧房问题的有效钥匙。未来,快手搜索团队将进一步探索CroPS与生成式检索方法的融合,持续挖掘大规模语言模型在搜索全链路中的潜力。
热门专题
热门推荐
在包子漫画App精准定位心仪漫画:从入门到精通的搜索指南 面对海量的漫画资源,你是否苦恼于如何快速找到自己想看的那一部?包子漫画App内置的智能搜索系统,正是你高效解锁全站精彩内容的利器。掌握以下搜索方法与技巧,你将能轻松驾驭这座漫画宝库,大幅提升找书效率。 第一步:快速找到搜索入口 启动包子漫画A
明日方舟终末地洛茜最强配队攻略:三大体系阵容搭配详解 在《明日方舟:终末地》的策略攻防世界中,角色组合与队伍构建是决定战局胜负的关键。作为当前版本的热门输出手,洛茜的配队方案备受玩家关注。本文将全面解析洛茜的核心配队思路,包括法术爆发、物理攻坚、五色极致及稳定进阶四大流派,帮助您根据自身box与资源
魔兽世界城市大门钥匙:功能详解与核心作用 开启核心区域通道 城市大门钥匙最基础的用途,便是解锁主城的主要入口,让玩家能够深入城市的中央区域。以经典例子铁炉堡大门钥匙来说,缺少这把钥匙,玩家便无法进入这座矮人王城的核心地带,只能在外围区域活动。 成功进入主城后,完整的游戏体验才正式开启。主城是玩家活动
奥兹玛攻坚战小队模式攻略:机制详解与高效通关指南 对于DNF玩家而言,奥兹玛攻坚战无疑是版本实力的重要试炼场。其中,小队模式以其独特的挑战性备受关注——它的难度究竟如何定义?实际上,攻克奥兹玛小队模式虽有章法可循,却也需要系统性的策略与准备,绝非仅凭蛮力就能轻易通关。 职业配置是基石,团队协同定胜负
七大罪起源红色魔神Boss攻略:三阶段机制详解与实战打法 在《七大罪:起源》中,世界等级3的最终守关首领“红色魔神”,以其极具挑战性的多阶段机制与极低的容错率,成为了当前版本团队副本的核心难点。许多队伍在此反复受挫,究其根本,往往是对Boss各阶段的技能逻辑、环境互动与团队配置策略缺乏系统性理解。本





