1688 AI原生应用创新探索与实践深度剖析案例分享_AI热点日报

1688平台以AI原生理念重构电商找挑链路，通过导购助手与找挑一体化方案，融合多轮对话、多模态内容解析及端到端智能引擎，突破传统检索割裂瓶颈，实现需求理解、智能推荐与闭环服务，显著提升供需匹配效率。

在电商领域，AI原生应用正在逐步打破一些看似无解的僵局。1688平台最近的一系列探索，或许能给我们一点启发：当用户找货、挑货的体验不再是“人适应系统”的时候，电商的下一步到底该怎么走。

今天这篇文章，想和大家聊聊AI在电商场景下的实战应用。重点会放在导购助手和“找挑一体化”这两个方向上，梳理一下思路，也算记录一下踩过的坑和收获。

AI在电商场景的应用

1688作为整合批发与零售业务的电商平台，它的完整链路涵盖了从商品发现到履约交付的众多关键环节。随着AI技术的快速发展，整个业务环节都在经历智能化重构。核心价值始终很明确：通过精准匹配客户需求与供应链资源，最大化供需决策效率——这正是AI能够创造最大价值的关键领域。

电商平台体验存在的痛点

说回实际体验。用户在电商平台上找东西、挑东西的效率，一直上不去，流程也不够顺畅。用户真正想要的，是平台能理解他们的需求，而不是在搜索框里反复试错、层层筛选。

目前来看，痛点主要集中在三个方面：

需求理解困境：用户的真实需求很难被精准捕捉。现在的电商平台还是“用户适配系统”的被动模式，消费者需要通过各种筛选、复杂操作来拆解自己的需求，甚至得配合系统的短板来完成购物。这种“人适应机器”的方式，让用户觉得平台不够贴心。
技术瓶颈制约体验：核心问题还是技术能力的局限性。传统的搜索依赖倒排索引和固定规则的检索逻辑，没法理解自然语言、把握上下文、挖掘隐性需求。技术上限决定了体验的天花板，团队只能在妥协中来回打转。
找挑链路割裂：从搜索到决策的链路是断开的。用户先通过检索缩小范围，再跳转到详情页看参数、看评论、看价格，比来比去才能做决策。虽然最后能解决问题，但整个过程非常碎片化。

不过，随着AI技术在自然语言处理、意图识别和个性化推荐上的突破，这些都有了新的解题可能。如果能构建一个主动理解需求、智能整合信息、无缝衔接找挑链路的AI原生应用，或许真能实现以用户为中心的体验跃升。

以买家为中心重新定义找挑

AI正在深刻地重构电商消费链路。1688以AI原生为核心理念，通过产品设计与技术方案的深度融合，打造全链路一体化服务。当用户觉得系统像是一个贴身服务时，才算是真正的价值落地。

在电商领域，用户“寻找与挑选”的传统模式一直困在旧有范式里。关键词检索、协同过滤这些规则构成了筛选的基础逻辑，用户需要通过静态页面逐项查找详情才能拿到关键信息。结果就是，用户习惯养成依赖页面浏览的导购方式，但信息检索和个性化需求之间的鸿沟，始终跨不过去。

新兴的对话式导购正在改变这一切。基于大模型的多轮对话系统，可以通过自然语言和视觉交互深度理解用户需求，结合推理能力精准捕捉偏好。系统能主动提炼关键信息做对比分析，用结构化摘要直接呈现个性化推荐。过去那种手动筛选的低效体验，正在被更智能的反馈机制所取代。

针对“找与挑”的痛点，我们在2024年3月构建了找挑一体化方案。这个方案打破了检索与推荐系统的割裂，通过ReACT框架的智能体模式，把双重功能整合在一起：既可以精准执行多维度商品检索，也能基于协同过滤强化的动态排序进行推荐。这种“检索-推理-决策”的闭环，第一次把用户需求理解、商品特征解析、个性化匹配全部纳入了统一技术框架。

ReACT模式下的找挑优化

ReACT模式采用闭环优化机制。用户输入需求后，AI通过多步骤推理将自然语言转成搜索引擎能识别的标准化品类关键词；搜索引擎返回结果后，系统会用语义分析模型评估相关性，如果匹配度不够，就迭代优化——扩展语义、调整结构，重复这个循环3-4次。最后输出的是经过多轮验证的最优结果集。这个模式把搜索和筛选整合成了一个端到端的解决方案，用户侧的操作简化到“输入-等待-获取”，很直接，也很有效。

当时的能力与问题

当然，方案落地时也遇到了一些现实问题：

当时GPT-4能满足自主规划需求，但成本太高，一次演示就要10块钱左右；
搜索引擎的能力成了整体方案的天花板，数据碎片化也影响了整合效果；
方案效果没有达到预期，AI成本虽然预判会下降，但当下必须跑起来。

方向是清晰的：找挑一体。但眼下，得先让它转起来。

AI导购智能体框架

确定方向后，我们先快速落地了整套方案。团队决定开发AI导购助手的智能框架，采用Agent与工作流编排结合的标准结构——和当前市场主流方案完全一致。

在AI应用路径上，存在两种模式：原生开发和兼容性改造。理想的AI应用就像特斯拉的纯电平台，从底层就适配AI特性；但实际上，受限于技术成熟度和平台兼容性，当时更现实的方案类似于“油改电”——保留传统架构主体，把核心动力模块替换成AI驱动引擎。虽然不尽完美，但能在过渡期平衡创新与兼容。

AI导购助手整个请求过程

这个设计理念的核心，是通过多轮对话保持意图理解的一致性。系统持续追踪用户意图脉络，把分散的对话片段串联成连贯的意图链路，实现“找货-推荐”的闭环。基本上，两到三次交互就能构建完整的购物需求画像，形成自然的对话引导式体验。这种设计解决了传统电商需求碎片化的问题，让理解和服务统一起来。

系统的核心竞争力源自AI驱动的导购助手模块，而意图判定是决定用户体验的关键。团队通过工程架构优化、产品逻辑设计、AI算法迭代的多维协同，最终实现了90%以上的判定准确率，为智能导购打下了技术基础。

在核心模块突破后，系统整合了多源数据接口和业务流程引擎，形成了完整的对话式导购解决方案。2024年5月，“找挑助手”功能正式上线。精准意图理解与智能推荐的深度融合，让用户在商品筛选和决策场景中的效率明显提升。

举个例子：用户说“晚上约会穿连衣裙搭配”，系统通过自然语言处理快速解析场景意图，同步完成需求翻译、商品检索和智能推荐。关键突破在于，将“搜索-筛选-推荐”这三个步骤无缝衔接——通过对话交互明确风格偏好（比如优雅还是甜美），结合约会场景的光线和社交属性，精准匹配商品库里的长款丝质连衣裙、露肩设计等选项。推荐时，系统会提炼每款商品的核心优势，用结构化对比强化决策依据，形成从需求理解到场景化方案的闭环。

AI导购助手落地带来的一些问题

落地过程中，一些核心问题开始暴露：

用户理解局限：系统依赖用户的精准表达，但缺乏细颗粒度的画像和行为数据，只能做到“猜你喜欢”，没法深度挖掘真实需求。
供给信息割裂：商品属性和用户语言之间存在语义鸿沟，比如“新生儿奶瓶”和“60ml奶瓶”没有关联起来，多模态数据（图片、详情页）也没有被结构化利用。
匹配效率低下：还是依赖关键词检索，没有实现用户意图与商品信息的语义级对齐，复杂需求处理不了。

对应的优化方向也很明确：

构建智能用户画像：整合多维度数据，提升需求理解的精准度；
多模态内容解析：结构化商品图文信息，弥合供需之间的语义鸿沟；
打造端到端智能引擎：通过语义建模实现需求与商品的高效匹配，替代传统倒排索引逻辑。

目标是让系统从“被动响应”升级为“主动理解”，从根本上提升用户体验。

1. 智能用户画像，从猜你所想到懂你所需

用户画像的推理链路分四个阶段：首先基于用户的历史行为、购买记录、搜索关键词等底层数据，结合市场趋势和商品属性，构建一个动态的画像；然后通过语义分析和关联规则，将当前查询（比如“学校门口的商品”）与画像交叉验证，识别出隐含需求——安全认证、价格区间、便携性等；最后生成满足多维约束的推荐结果，比如“奥特曼联名3C认证错题本，10-15元，安全便携”。这个链路通过整合多维度数据，替代了单一的需求翻译，实现了从浅层匹配到深度理解的跃迁。

2. 统一多模态商品内容，实现统一模态商品的知识组织

下一步的重点是用AI优化多模态信息理解。现有商品信息挖掘得不够，需要从详情图中解析和结构化关键信息。但对数十亿级图片做这样的处理，现有开源方案（比如GPT）很难高效实现，挑战不小。

基于GPT-4的对话数据增强技术，我们用了0.5B参数的Visual Instruction Tuning模型和LLM结合做基准测试，关键指标比GPT-4高了0.1个百分点（GPT基线0.7分，本方案0.81分）。经过半年的系统性工程，团队完成了10亿级图像数据的结构化处理和深度清洗，构建了跨模态统一的商品知识体系。每个商品实体都变成了类似百科全书的结构化文档，多模态信息的语义化组织显著提升了AI的知识调用效率。

3. 打造智能引擎实现高效匹配与满足

数据已经结构化、清洗到位，多模态也对齐统一了。有了需求和供给，接下来就是通过端到端智能引擎来实现高效匹配。

（1）召回侧模型

这个方案基于对比学习优化大模型，用Cosine Embedding Loss作为损失函数。核心改进在于：针对用户自然语言需求与长文本商品文档的语义对齐需求，对通义模型的单向注意力机制进行改造，引入双向注意力机制，通过缩小query与商品在语义空间的表征距离来提升对齐效果。

（2）排序侧模型

排序模型必须以精准满足用户需求为核心，而不是依赖CTR/CVR这些传统指标。排序逻辑应该直接关联用户搜索意图的满足度，确保高相关性商品优先展示。比如用户搜索“胡萝卜图案小包包”，应该直接展示胡萝卜图案的商品，而不是间接相关的“小兔子抱胡萝卜”。传统模型因为指标偏差，常常掩盖了真实需求的匹配度。

系统架构调整后，虽然召回引擎和排序模型在技术上保持独立，但都统一围绕着解析用户需求这个核心目标来串联。各子模块协同完成召回、排序和判定，形成了系统级的联动。

举个例子，用户想推荐适合去哈尔滨穿的羽绒服。需求可以转化为：高蓬松度、鹅绒长宽比、版型设计、防风防水功能及科技面料等核心参数。系统通过向量模型对这些特征做多维度召回和倒排索引，生成候选池；然后基于“哈尔滨极寒”这个场景意图进行排序优化，优先提升高蓬松度鹅绒填充、防风防水处理的商品的曝光权重；最后对TOP商品做双重校验，确保技术参数（如蓬松度数值、面料防泼水等级）和用户隐含需求（极致保暖、场景适配性）强关联。

基于需求建模的模块化系统架构已经设计完成。系统通过用户需求输入启动智能分析：AI引擎解析需求特征，通过多模态内容分析精准匹配，最后生成推荐结果供用户评估。2024年10月，我们计划推出AI深度产品寻觅系统——需求与商品的双向验证机制会彻底重构传统搜索路径，形成智能分析驱动的闭环服务模式。

如上图所示，右边是整个思维链，推理出用户的真正需求是什么，然后呈现结果。绿色勾和红色叉表示当前需求是否满足用户。用户不用点开详情，AI已经帮你挑了一遍。当用户想查看哪些需求不满足时，再点开详情，会发现所有动态信息都是可理解的——多模态图像内容和商品内容都可以用来佐证为什么推荐这个商品。在这个系统里，用户可以直观地看到找挑以及推荐的依据。

目前，这个能力已经成功集成到AI导购助手中。导购助手的智能推荐逻辑全面升级为端到端思维链体系，并融入了需求验证机制，实现了完整的需求满足闭环。这背后，是工程、算法与产品团队深度协同的结果。

模型到产品的三层策略

从模型到产品，有三层策略可以走：端到端的原生模型方案、子任务协同的pipeline机制、产品兜底交互设计。两条路径并行：一条是模型即产品；一条是AI大模型加workflow，以Agent的形式做产品优化。

1. 端到端的原生模型方案

如果能实现端到端，一定要选这条路。它最简洁，结构简单、链路短、泛化性强。端到端的方案可以转成数学问题，直接对目标建模。

2. 子任务协同的pipeline机制

大多数场景暂时还做不到端到端，所以需要把问题拆成多个子任务协同处理。这也是我们做导购助手的方式：把所有算法问题、模型问题切成一个个子问题，通过一个很强的工程链路串起来解决。第一代服务和深度找货应用都是基于这种模式实现的。

3. 产品兜底交互设计

子任务协同模式也有很多解决不了的问题。比如用户需求怎么理解都不准，这时需要产品经理出来兜底——不允许发散输入，设置5个按钮，把需求框定。虽然“智能”的程度降低了，但至少可用。AI产品必须和AI工程、AI算法结合，才能形成完整的协同闭环。

未来AI应用的方向

1. 往Agent的路线走

当下90%的模式还是Agent模式。提前定义好AI要做什么，每个agent和workflow的编排，让AI沿着路径和节点把问题执行掉。

技术越来越智能，未来或许不需要人工干预，只需要向AI明确任务目标，就能实现自动化工作流编排（Manus、Deepsearch这些企业已经在探索了）。但挑战依然很大：虽然每个节点的操作都符合逻辑，最终输出却可能产生意想不到的负面结果。追查问题时，每个执行环节都显示正常——这种系统性错误的归因，已经成为技术落地的核心难题。

2. 往模型端到端路线走

电商平台推荐系统需要处理海量商品数据，规模可达亿级。链路构建会形成庞大的系统工程，面临Prompt工程复杂度增加和模型上下文容量的严峻挑战。如果未来模型能支持万亿级上下文和P级显存，推荐服务可能只需要简单的Prompt——输入就能得到精准结果，这或许是LLM框架下最优的推荐方案。

这套模式适配的场景也不少。比如苹果商城，SKU有限，把商品信息全部写入上下文，大模型就能直接有效应用；小米商城也类似。但对大电商平台来说，可能需要万亿级别的上下文支持才能真正解决问题。

未来的多模态端到端方案，需要通过算法对文本、图像、声音进行联合分布建模与表征压缩，结合强编码能力的自回归模型，利用联合分布解码生成目标输出。

在电商场景中，通过构建商品信息与用户需求的联合分布模型，基于大模型实现商品信息的深度嵌入，直接用确定性映射或高效编码器完成端到端的内容生成。这个路径以模型为核心，不需要传统搜索引擎或复杂协同系统，就能实现搜索与推荐一体化的“找挑”功能，是电商智能化的重要探索方向。

问答环节

Q1：早期用GPT-4o模型时，一次找挑服务需要10元的成本，现在降到多少？

A1：国内自主研发的智能模型已经能胜任各类任务了，成本优势明显，性能也够高。尤其是三步规划内能解决的问题场景，成本已经不是核心问题。

Q2：多轮对话中，用户不一定有耐心把所有对话走完，几步没解决需求就放弃了？

A2：从数据看，真正的用户对话大多数不超过三轮。三轮是体验的极限，我们的能力上限是七轮，但对用户来说，三轮以内基本就结束了。

Q3：中间的召回模型参数量是多少？

A3：模型参数不会太大。学习目标是对比学习任务，本质上是两向量空间的相关性逻辑，解决不了推理性问题。大模型真正有魅力的地方是推理能力的涌现，而这个范式解不了推理，所以模型不需要很大就能很好拟合。我们用0.5B到1B左右，就能解这个问题，效果也不错。

Q4：和ID based的双塔模型比，有什么不同？

A4：对齐的目标不一样。如果用这个方式去建对齐目标，传统技术也能做，但它是把ID映射到向量空间做相关性。我们这里不是ID，还有明确比例的上下文信息。从ID角度看，商品ID的表单量太大了，压缩进模型和ID based双塔模型是两个不同的东西。它是在预训练环境上做的，不是从零开始训练的模型。

Q5：去哈尔滨旅游推荐衣服，是个推理问题。哈尔滨是common knowledge，大模型能解。具体到商品层面怎么做？垂直领域应用，大模型缺少业务知识怎么办？

A5：这是个复杂的思维链过程。我们定了一个非常复杂的prompt逻辑，刚开始用的不是推理模型，DeepSeek出来后才有。之前是通过人工的方式定了复杂的思维链，会挂载互联网信息，把外部信息拿来翻译。效果很大程度上取决于prompt写得多好——只要模型够好，写一个复杂的prompt就能做到。结合模型已有知识，大概率能推理出来。比如冬天的哈尔滨，温度多少，带进去就能推算出需要高蓬松度这些参数。本质上还是把用户需求翻译成电商场景需要的维度信息，是个大模型的翻译过程，还没到电商系统本身。通过搜索加上大模型分析，就能拿到想要的内容。

Q6：垂直领域比如餐饮外卖，做RAG检索，有特殊领域知识，大模型不懂，需要告诉它KPI和业务指标之间的相关性？

A6：RAG工程能解，但需要专门训练，也要和系统结合。要达到比较好的水平上线，中间的训练步骤不能省。但RAG不是完美解法——只要召回不了，就没结果，上限就是RAG本身。未来端到端训练这样的模型也有机会，但训练的不稳定性会把成本拉高。RAG相对来说是当前性价比比较高的方法。

Q7：未来端到端，把商品信息都放到模型的上下文里，可行吗？

A7：平台有上亿商品，每个商品如果按1,000个token算，1亿乘以1,000的量级。现在没有任何一个大模型能支持1,000亿的上下文。如果大模型上下文够长，硬件也跟得上，这会是粗暴有效的方法。

Q8：宝妈想给新生儿买奶瓶，用户行为是怎样的？传统系统怎么满足？新系统能做得更好吗？

A8：现在的用户普遍是先去社交媒体，看到对应的奶瓶，再到1688上图搜解决问题。社媒平台是根据用户需求构建内容，电商平台是根据商品供给信息构建商品。真正要解决问题，需要在用户语言和商品供给语言之间做翻译——怎么翻译，需要大量数据清洗。以前通过知识图谱，把消费者的话映射到关键词，搜索引擎还有Query Rewriting模块，配大量的词汇表，本质上就是建立用户需求和供给者之间的映射关系。

以上就是本次分享的内容，谢谢大家。