技术圈最近举办了一场颇具亮点的活动——快手技术沙龙第四期,本次聚焦于生成式推荐这一前沿方向。整场沙龙围绕 OneReason、Pool-Rec、OneSearch V2、GR4AD 等核心技术实践展开,系统梳理了快手在生成式推荐领域的最新探索成果。

活动现场还正式发布了全新赛事:「快手探索者 LLM-Rec 挑战赛」。该赛事由快手与 ACM SIGIR 2026 联合举办,瞄准大模型与推荐系统融合的技术方向。面向全球全日制在校学生开放,不限国籍、院校与专业背景。
快手基础大模型与应用部、推荐模型部负责人李晗在发布赛事时指出,快手希望通过开放真实业务场景与前沿课题,加速大模型与推荐技术的深度整合。他鼓励参赛者将推荐模型与大语言模型的各自优势相结合,探索推荐系统向更高阶智能演进的可行路径。简而言之,就是期待更多创新想法不仅停留在论文层面,而是能被验证、被实践、被行业看见。
OneReason:让推荐系统具备思考与推理能力
先看一个已经得到验证的方向。OneRec 系列生成式推荐模型已在多个业务场景中成功落地,并在 next-token prediction 框架下享受到了 Scaling 的红利。下一步的关键问题已经转变:模型不能仅仅“生成结果”,还必须能够“理解原因”并“完成推理”。
快手推荐模型部生成与排序模型负责人唐睿明分享了 OneReason 的核心设计思路。要让生成式推荐模型获得类似大语言模型深度 Reasoning 带来的能力跃升,就必须系统性地为推荐场景构建推理能力。具体实施上,团队搭建了一套面向推荐任务的 CoT 数据体系,用于激发模型在推荐过程中的真实推理机制;同时在推荐任务的 RL 阶段引入了 Reasoning 数据飞轮,通过多轮迭代持续优化 CoT 质量。效果表明,推荐场景中模型的推理能力获得了显著提升。
OneReason 的探索释放了一个重要信号:生成式推荐正从 Scaling 走向 Reasoning。这为推荐系统在复杂场景下的决策能力升级,提供了一条全新的技术路径。
Pool-Rec:基于异构算力池化的推荐预估系统
生成式推荐模型持续 Scaling,底层算力供给、推理架构与系统效率必须同步跟进。快手计算引擎架构负责人柳嘉强介绍了 Pool-Rec——基于异构算力池化的推荐预估系统。其核心思路是通过基础设施、算力调度与推理引擎的系统级升级和协同优化,实现 AZ 级异构资源的统一池化与弹性供给。
这套系统大幅提升了模型算力利用率 MFU,同时推动推荐预估系统向高密 GPU 架构与分布式推理方向演进。它不仅支撑了 OneRec 系列生成式模型的工业级落地,也为推荐模型持续 Scaling 提供了一个高性能、高效率、可扩展的系统底座。
工业级生成式搜推的下一阶段:从生成候选到生成决策
生成式检索与推荐已从前沿探索逐步走向工业主链路。当前真正的挑战不再是“能否生成候选”,而是如何让模型具备复杂意图理解、推理决策和偏好对齐的能力。快手货架电商推荐与搜索负责人杨一帆结合 OneSug、OneSearch V1、OneSearch V2 等 One 系列工业实践,系统梳理了生成式搜推从 query 生成、item 生成,到推理能力内化和生成决策的演进路径。
在电商场景中,用户需求表达往往带有模糊性、多样性和强上下文特征。生成式搜推框架凭借更强的语义理解与生成能力,为复杂意图建模和商品匹配打开了新空间。面向下一阶段,兴趣编排、搜推一体和主链路闭环,将是生成式搜推持续突破的关键方向。
GR4AD:生成式广告推荐的工业实践——从Token到Revenue
如何将生成式推荐能力转化为可验证的商业增长?快手商业化直播模型与内循环召回负责人吴文金分享了 GR4AD 的解决方案。该方案以 OneRec 的 decoder-only 架构为基础,结合广告业务特点,在表征、学习与服务三个层面进行协同优化:引入多模态语义主成分 ID 增强模型对广告内容和用户兴趣的表达能力;提出懒惰自回归 Lazy AR 与价值感知学习来对齐业务目标;同时建设了商业化实时训练与推理服务体系,确保大规模线上场景下的稳定落地。
目前 GR4AD 已在快手广告平台全面部署,带来的业务收益十分显著。
站在推荐系统新一轮范式变革的节点,生成式技术正在推动工业级智能系统从“精准匹配”向“理解、推理与决策”演进。快手接下来也将围绕统一技术基座、推理增强和系统效率持续探索,推动生成式推荐不断向前发展。
另外值得一提的是,「快手探索者 LLM-Rec 挑战赛」现已正式启动,面向全球全日制在校学生开放。快手期待与更多青年技术人才一同探索生成式推荐的未来,共同定义下一代智能推荐系统。
