基于大语言模型的智能客服选车助手_AI热点日报

基于大语言模型的智能客服选车助手

类型：热点整理2026-06-01

针对用户表达多样、交互僵化等问题，基于大语言模型构建多智能体选车助手，包含NLG和NLUAgent。通过检索增强生成技术将货物信息识别准确率提升至90%，实现流程引导与拟人化回复，提供更自然、可控的对话体验。

智能客服行业近年来发展迅猛，但许多用户仍遭遇“答非所问”的体验困境。例如，用户提问“有优惠券吗？”，系统却自顾自地推荐车型，令人困扰。本文将探讨货拉拉如何借助大模型技术，将选车助手这一看似简单的场景打造成高效、智能的典范。

背景介绍

首先简要回顾基础知识。客服咨询场景主要分为两类：一类是FAQ（常见问题解答），用户提问、系统直接回复；另一类是任务型对话，需要逐步引导用户完成操作，例如取消订单或开具发票。AI客服的本质是利用人工智能技术实现上述功能，核心目标在于提升效率与服务质量，同时降低运营成本。选车助手正是AI客服中一个典型的子场景，专注于帮助用户挑选合适的车型。

选车助手概况

为了更准确地为您推荐合适的车型，请您配合回答几个问题即可~ 请问您的货物重量是多少呢？您可以选择以下接近的选项，或直接输入“0.5吨”“1吨”等数值。

（此处包含货物重量选项列表）

只剩2个问题喽~请您根据货物长度选择以下选项，或者手动输入如“4米”。如果货物数量较多，只需提供最长件的长度（例如床的长度为2米）。温馨提示：这里指的是物品平放于车厢内从头到尾的长度，不能倒放的物品（如冰箱）切勿将其高度计为长度哦～

（此处包含货物长度选项列表）

最后一个问题啦，不要走开！请选择以下要运输的物品类型。如果列表不含所需选项，可以输入“水果”“装修建材”等关键词。

（此处包含物品类型选项列表）

（以下是用户与助手的真实对话案例，展示了助手无法理解用户问题的不良体验）

从上述案例中可以看出，系统暴露了以下几个典型问题：

1. 仅能识别预设的几种类别，货物信息获取不完整，导致车型推荐不准确。

2. 完全依赖点选，交互方式僵硬，无法处理“一个桌子、一台七十寸电视”这类复杂表达。

3. 回复内容冗长啰嗦，缺乏人性化沟通。

4. 一旦用户偏离主流程提问（如同优惠券），机器人即陷入“宕机”状态，体验极差。

技术背景

目前市面上主流的商业解决方案普遍偏重“保守”路线——强调可控性，牺牲灵活性。客服人员需要先绘制出复杂的流程图、编写大量死板规则，系统则严格按此执行。结果用户稍有偏离，体验便急剧下降，只能转接人工客服，反而增加了运营成本。

然而，过去一年间，大模型技术发生了翻天覆地的变化，基于其构建的智能体展现出巨大潜力。巧合的是，货拉拉内部也自主研发了货运大模型，这为彻底重构选车助手提供了坚实的技术底气。

系统框架

整套选车助手服务系统的架构从上至下分为四层：

交互层：支持Web、App、小程序等多种入口，用户可从任意渠道接入。
应用层：包含IM后台与WebSocket网关，负责消息通道的建立与维护。
逻辑层：即DM对话机器人系统，负责会话管理与流程控制。
算法层：作为核心大脑，采用Multi-Agent框架，并结合内部机器学习平台（海豚平台）进行模型管理。

图1 客服选车助手系统框架图

算法方案

通过分析线上数据发现，用户行为完全不可控。他们并不会严格按预设流程操作，时常在对话中突然提问“有优惠券吗？”（FAQ类问题）或“今天天气咋样？”（闲聊类问题）。如何在推进主流程的同时，又不生硬地引导用户回归正题，成为一大难点。此外，货物种类繁多，用户描述方式也千差万别，准确理解其意图极具挑战。

我们选择结合大模型来突破困境，主要基于其三大核心能力：强大的理解能力（能够准确定位各种表达方式）、智能的生成能力（使回复更自然、体验更佳）、以及跨语言能力（支持多语种对话）。

LLM-based多智能体系统

为确保大模型Agent在执行任务的同时保持可控性，我们采取了务实的路线：利用SOP（标准作业程序）分解任务，实现对Agent的细粒度控制，从而更容易落地实施。

图2 LLM-based多智能体系统图

单一智能体难以胜任复杂任务，因此拆分为两个：NLG Agent负责回答用户问题、调用工具、引导对话流程；NLU Agent则专门从对话中提取货物信息。

NLG Agent

当收到用户提问后，该Agent首先判断问题类型，随后决定处理方式。示例如图3所示。它还会与Memory、Tools以及NLU Agent进行协同交互。

图3 NLG Agent示例

Memory

图4 Memory模块图

Memory中存储了三类先验知识：

通用知识库：当用户提及“电动车”时，系统自动补全其尺寸和重量，无需再追问细节。
FAQs：用户询问“客服电话”时，直接输出正确回复。
长短记忆：对话历史记录，使Agent记住上一轮内容，实现更好的上下文配合。

Tools

图5 Tools模块图

Tools负责与外部系统对接，包含以下组件：

车型推荐接口：根据NLU Agent收集的信息，精准推荐合适车型。
敏感词过滤接口：作为安全红线，必不可少。
业务SOP：用于指导对话节奏，避免在闲聊上浪费时间。
流程引导：综合所有信息，决定下一步是回复FAQ问题还是继续询问货物信息。

NLU Agent

这是整个系统最关键的环节。选车助手的核心任务是根据货物信息推荐车型，但用户的表述极为丰富多样——

“我要拉一个箱子，长1米”（仅提供部分信息）
“我要拉20个1m*1m*1m的箱子”（多个同规格物品）
“我要拉1.8m的床和冰箱”（多个不同物品）
“长1.8m，重量不清楚”（信息模糊）

如何从这些表述中精准提取信息，既是难点也是重点。传统NER方法需要大量标注样本和训练周期，且在处理实体嵌套时容易出错。

我们尝试了自研的货运大模型，初始基线在内部测试集上准确率仅为50%。经过一轮prompt调优后，最高也只达到60%。分析bad case发现，模型对“不清楚多重”“外机700×400×500”这类表述难以处理。为此，我们引入了RAG（检索增强生成）技术。

图6 RAG基本流程图

在召回阶段采用多路召回策略：

向量召回：寻找语义相似的问法，例如“1.5长 70cm高 74宽”，系统可依据常识补全为“长1.5米，宽74厘米，高70厘米”。
货物名称召回：根据“电视”“冰箱”等具体名称，匹配同类货物的典型信息，如“60寸液晶电视”。

通过多路召回RAG，准确率直接提升至80%。

此外，在第n轮对话时，将前一轮（n-1轮）收集到的信息作为上下文输入，对效果提升明显。再配合一些硬编码规则处理固定句式，最终内部测试集上的货物信息识别准确率稳定在了90%。

表1 迭代效果对比展示

效果展示

示例1

（以下是新系统的真实对话案例）

用户询问优惠券，助手不仅完整回答，还能顺势将话题拉回主流程（“请问桌子的长度、重量？”）。当用户指出重量信息有误时，助手能准确理解上下文，立即更新推荐车型（从小面换为中面）。

效果分析：

流程引导：回答问题后主动回归主线。
拟人化回复：语言简洁、更接近真人沟通。
上下文理解：用户更正信息后，推荐实时更新。

示例2

（另一个真实对话案例）

用户表示“一个桌子，一个七十寸的电视机”，助手直接询问桌子信息，而对七十寸电视的尺寸和重量了然于胸（具备常识）。用户称“重量不清楚”，模型也能自动推理出桌子的大致重量，无需额外追问。

效果分析：

多物品信息理解：能处理“一个桌子，一个电视”这类复杂输入。
具备常识：七十寸电视无需再问重量，桌子重量不确定时也能自动推断。

总结展望

这是大模型在货拉拉业务中的一次务实落地。面对具体业务场景的实际挑战，我们没有盲目追逐花哨技术，而是结合自研货运大模型，采用多智能体架构，稳扎稳打地打造出兼具“人情味”与“懂业务”的AI客服选车助手。未来，我们将持续优化迭代，并将这些能力推广至更多客服场景，进一步提升用户服务体验。

来源：https://www.53ai.com/news/gerentixiao/1350.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。