游乐游手机版
首页/AI热点日报/热点详情

基于大语言模型的智能客服选车助手

类型:热点整理2026-06-01
针对用户表达多样、交互僵化等问题,基于大语言模型构建多智能体选车助手,包含NLG和NLUAgent。通过检索增强生成技术将货物信息识别准确率提升至90%,实现流程引导与拟人化回复,提供更自然、可控的对话体验。

智能客服行业近年来发展迅猛,但许多用户仍遭遇“答非所问”的体验困境。例如,用户提问“有优惠券吗?”,系统却自顾自地推荐车型,令人困扰。本文将探讨货拉拉如何借助大模型技术,将选车助手这一看似简单的场景打造成高效、智能的典范。

背景介绍

首先简要回顾基础知识。客服咨询场景主要分为两类:一类是FAQ(常见问题解答),用户提问、系统直接回复;另一类是任务型对话,需要逐步引导用户完成操作,例如取消订单或开具发票。AI客服的本质是利用人工智能技术实现上述功能,核心目标在于提升效率与服务质量,同时降低运营成本。选车助手正是AI客服中一个典型的子场景,专注于帮助用户挑选合适的车型。

选车助手概况

为了更准确地为您推荐合适的车型,请您配合回答几个问题即可~ 请问您的货物重量是多少呢?您可以选择以下接近的选项,或直接输入“0.5吨”“1吨”等数值。

(此处包含货物重量选项列表)

只剩2个问题喽~请您根据货物长度选择以下选项,或者手动输入如“4米”。如果货物数量较多,只需提供最长件的长度(例如床的长度为2米)。温馨提示:这里指的是物品平放于车厢内从头到尾的长度,不能倒放的物品(如冰箱)切勿将其高度计为长度哦~

(此处包含货物长度选项列表)

最后一个问题啦,不要走开!请选择以下要运输的物品类型。如果列表不含所需选项,可以输入“水果”“装修建材”等关键词。

(此处包含物品类型选项列表)

(以下是用户与助手的真实对话案例,展示了助手无法理解用户问题的不良体验)

从上述案例中可以看出,系统暴露了以下几个典型问题:

1. 仅能识别预设的几种类别,货物信息获取不完整,导致车型推荐不准确。

2. 完全依赖点选,交互方式僵硬,无法处理“一个桌子、一台七十寸电视”这类复杂表达。

3. 回复内容冗长啰嗦,缺乏人性化沟通。

4. 一旦用户偏离主流程提问(如同优惠券),机器人即陷入“宕机”状态,体验极差。

技术背景

目前市面上主流的商业解决方案普遍偏重“保守”路线——强调可控性,牺牲灵活性。客服人员需要先绘制出复杂的流程图、编写大量死板规则,系统则严格按此执行。结果用户稍有偏离,体验便急剧下降,只能转接人工客服,反而增加了运营成本。

然而,过去一年间,大模型技术发生了翻天覆地的变化,基于其构建的智能体展现出巨大潜力。巧合的是,货拉拉内部也自主研发了货运大模型,这为彻底重构选车助手提供了坚实的技术底气。

系统框架

整套选车助手服务系统的架构从上至下分为四层:

  • 交互层:支持Web、App、小程序等多种入口,用户可从任意渠道接入。
  • 应用层:包含IM后台与WebSocket网关,负责消息通道的建立与维护。
  • 逻辑层:即DM对话机器人系统,负责会话管理与流程控制。
  • 算法层:作为核心大脑,采用Multi-Agent框架,并结合内部机器学习平台(海豚平台)进行模型管理。

图1 客服选车助手系统框架图

算法方案

通过分析线上数据发现,用户行为完全不可控。他们并不会严格按预设流程操作,时常在对话中突然提问“有优惠券吗?”(FAQ类问题)或“今天天气咋样?”(闲聊类问题)。如何在推进主流程的同时,又不生硬地引导用户回归正题,成为一大难点。此外,货物种类繁多,用户描述方式也千差万别,准确理解其意图极具挑战。

我们选择结合大模型来突破困境,主要基于其三大核心能力:强大的理解能力(能够准确定位各种表达方式)、智能的生成能力(使回复更自然、体验更佳)、以及跨语言能力(支持多语种对话)。

LLM-based多智能体系统

为确保大模型Agent在执行任务的同时保持可控性,我们采取了务实的路线:利用SOP(标准作业程序)分解任务,实现对Agent的细粒度控制,从而更容易落地实施

图2 LLM-based多智能体系统图

单一智能体难以胜任复杂任务,因此拆分为两个:NLG Agent负责回答用户问题、调用工具、引导对话流程;NLU Agent则专门从对话中提取货物信息。

NLG Agent

当收到用户提问后,该Agent首先判断问题类型,随后决定处理方式。示例如图3所示。它还会与Memory、Tools以及NLU Agent进行协同交互。

图3 NLG Agent示例

Memory

图4 Memory模块图

Memory中存储了三类先验知识:

  • 通用知识库:当用户提及“电动车”时,系统自动补全其尺寸和重量,无需再追问细节。
  • FAQs:用户询问“客服电话”时,直接输出正确回复。
  • 长短记忆:对话历史记录,使Agent记住上一轮内容,实现更好的上下文配合。

Tools

图5 Tools模块图

Tools负责与外部系统对接,包含以下组件:

  • 车型推荐接口:根据NLU Agent收集的信息,精准推荐合适车型。
  • 敏感词过滤接口:作为安全红线,必不可少。
  • 业务SOP:用于指导对话节奏,避免在闲聊上浪费时间。
  • 流程引导:综合所有信息,决定下一步是回复FAQ问题还是继续询问货物信息。

NLU Agent

这是整个系统最关键的环节。选车助手的核心任务是根据货物信息推荐车型,但用户的表述极为丰富多样——

  • “我要拉一个箱子,长1米”(仅提供部分信息)
  • “我要拉20个1m*1m*1m的箱子”(多个同规格物品)
  • “我要拉1.8m的床和冰箱”(多个不同物品)
  • “长1.8m,重量不清楚”(信息模糊)

如何从这些表述中精准提取信息,既是难点也是重点。传统NER方法需要大量标注样本和训练周期,且在处理实体嵌套时容易出错。

我们尝试了自研的货运大模型,初始基线在内部测试集上准确率仅为50%。经过一轮prompt调优后,最高也只达到60%。分析bad case发现,模型对“不清楚多重”“外机700×400×500”这类表述难以处理。为此,我们引入了RAG(检索增强生成)技术。

图6 RAG基本流程图

在召回阶段采用多路召回策略:

  • 向量召回:寻找语义相似的问法,例如“1.5长 70cm高 74宽”,系统可依据常识补全为“长1.5米,宽74厘米,高70厘米”。
  • 货物名称召回:根据“电视”“冰箱”等具体名称,匹配同类货物的典型信息,如“60寸液晶电视”。

通过多路召回RAG,准确率直接提升至80%。

此外,在第n轮对话时,将前一轮(n-1轮)收集到的信息作为上下文输入,对效果提升明显。再配合一些硬编码规则处理固定句式,最终内部测试集上的货物信息识别准确率稳定在了90%

表1 迭代效果对比展示

效果展示

示例1

(以下是新系统的真实对话案例)

用户询问优惠券,助手不仅完整回答,还能顺势将话题拉回主流程(“请问桌子的长度、重量?”)。当用户指出重量信息有误时,助手能准确理解上下文,立即更新推荐车型(从小面换为中面)。

效果分析:

  • 流程引导:回答问题后主动回归主线。
  • 拟人化回复:语言简洁、更接近真人沟通。
  • 上下文理解:用户更正信息后,推荐实时更新。

示例2

(另一个真实对话案例)

用户表示“一个桌子,一个七十寸的电视机”,助手直接询问桌子信息,而对七十寸电视的尺寸和重量了然于胸(具备常识)。用户称“重量不清楚”,模型也能自动推理出桌子的大致重量,无需额外追问。

效果分析:

  • 多物品信息理解:能处理“一个桌子,一个电视”这类复杂输入。
  • 具备常识:七十寸电视无需再问重量,桌子重量不确定时也能自动推断。

总结展望

这是大模型在货拉拉业务中的一次务实落地。面对具体业务场景的实际挑战,我们没有盲目追逐花哨技术,而是结合自研货运大模型,采用多智能体架构,稳扎稳打地打造出兼具“人情味”与“懂业务”的AI客服选车助手。未来,我们将持续优化迭代,并将这些能力推广至更多客服场景,进一步提升用户服务体验。

来源:https://www.53ai.com/news/gerentixiao/1350.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。