有没有遇到过这样的情况:跟智能体聊了半天,它突然又问“你是谁?”,好像之前的一切对话都从未发生过。这种“健忘”在技术层面,通常指向一个核心问题——用户画像记忆功能没有配置好,或者说,根本没配置。
这是个很现实的问题。智能体如果不能持续“记住”你是谁、你做过什么、你喜欢什么,那它本质上就只是一个问一句答一句的“对话机器人”,离“智能助手”还差得远。接下来的内容,就是一套从底层到应用层、从长期到短期的完整方案,专门解决这个“认人”的问题。

一、启用长期记忆并绑定用户维度存储
说白了,长期记忆就是让智能体记住你的“基本功”。没它,每次对话都是“初次见面”。它背后的逻辑是把用户身份、设备标识、行为偏好这些关键信息,映射到一个独立的数据库里,每次请求时自动把上下文带进来,让智能体始终知道“对面是谁”。
具体的操作路径是这样的:
第一步,进入MaxKB v2.9.0的智能体配置页面,在“记忆管理”模块里,把长期记忆的开关打开。这一步不难,但很容易被忽略。
第二步,在“用户维度绑定”选项里,选择“按用户ID自动隔离”。这个设置很关键——它保证不同用户的记忆数据是物理隔离的,张三的记忆不会混到李四的对话里,互不干扰。
第三步,也是容易出错的一步:在系统提示词里,找到role为system的消息,在最前端插入变量{memory}。注意,这个变量必须独立成行,不能跟其他指令混在一起写,否则可能不生效。
配置完成后怎么验证?很简单,先给智能体发一条带有身份标识的消息,比如“我是张伟,注册手机号138****1234,常用城市是深圳”。然后隔几轮对话,再问它“我的名字和城市是?”。如果它能准确复述,那说明长期记忆已经成功激活。
二、配置分层短期记忆快照
长期记忆管的是“你是谁”,短期记忆则负责“你现在想干什么”。它捕捉的是当前会话周期内的实时状态——比如用户临时修改的偏好、突发性的需求、或者上下文中的敏感意图。它的价值在于弥补长期记忆更新延迟的问题,形成一个“8轮内有效”的轻量级画像快照。
配置起来也不复杂:
在智能体工作流节点中,添加一个“短期记忆快照”组件,设置保留轮次为8轮,超过自动清空。需要捕获的画像字段包括:当前设备类型(iOS/Android/Web)、输入语言(zh-CN/en-US)、活跃时段(morning/afternoon/night),以及最近三次点击的工具类型。
在每轮用户输入前,由前置节点自动把快照内容拼接好,格式类似:[快照]设备:iPhone15;语言:zh-CN;时段:evening;工具:知识库检索。
验证的方法也很直观:连续发三条不同语言的请求——中文、英文、中文。观察智能体在第三条响应中,是否还能维持中文输出的习惯。如果它没有因为中间插了一条英文就切换成英文回复,就说明短期快照在起作用。
三、接入外部用户向量库进行画像增强
如果说前两步解决的是“单设备、单会话”的记忆问题,那外部向量库要解决的,就是“跨设备、跨会话”的画像关联。它的思路是把用户行为日志通过语义建模转化为稠密向量,这样即使不是同一个设备登录,系统也能通过向量相似度把用户“认出来”。
具体操作:先在MaxKB平台的“资源中心”里创建一个用户向量库实例,建议选择Sentence-BERT作为嵌入模型。然后把用户的注册信息、历史对话摘要、工具使用频次等结构化数据批量导入,生成每个user_id对应的唯一向量。
接着,在智能体推理链路中启用“向量画像检索”功能,设定相似度阈值为0.68。当新的用户请求进来时,系统会去向量库中匹配,如果命中,就把匹配到的画像信息注入到提示词末尾,格式为“[画像]:职业=产品经理;倾向=图文优先;禁忌=不提竞品名称”。
怎么测试?在手机端完成一次“偏好设置”对话后,立刻用网页端发起一个新会话,问它“我上次说喜欢哪种报告形式?”。如果它还能返回“图文形式”,那就说明跨设备的画像关联已经打通了。这个效果,才是真正意义上的“认得你”——不管你换什么设备。
四、嵌入128维用户状态向量
这是一种更底层的技术方案。它的做法,是把用户的身份元数据压缩成一个固定维度的稠密向量,直接塞到Transformer输入序列的起始位置。这样一来,模型在token级别就能感知到用户的本质特征,避免用自然语言描述带来的歧义和漂移。
需要定义四项必填元数据字段:用户ID哈希值、注册时长(天)、高频交互工具类别、平均响应等待时长(秒)。然后使用MaxKB内置的编码器,把这些字段映射为一个128维的浮点向量。这个向量生成后是固定的,不能人工修改。
在模型输入层,把这个向量作为第一个特殊token插入,位置编号为0。为什么要放在0号位?因为注意力机制会优先关注序列起始位置的信息,这就确保了用户状态特征能被模型优先处理。
验证方法也很巧妙:向智能体发送“我等了好久”。如果系统中记录的平均等待时长字段值大于120秒,它应该触发安抚语句“已为您加速处理”;如果等待时长较短,则不会有这个响应。通过这种触发式效果,就能判断向量是否真的注入了模型决策过程。
五、设置关键词触发式画像唤醒机制
这是最后一个环节,但也是实际应用中非常实用的一步。它的逻辑很简单:当用户输入中间出现了特定关键词,系统就主动唤醒对应的画像片段。这种方式的优点是开销低、精度高,特别适用于用户主动声明身份或切换角色的场景。
配置方法:在“画像唤醒规则”中新增一条规则,触发词可以设置为“我是老用户”“用过三年”“还记得我吗”。当这些词出现时,系统加载全部长期记忆,再加上最近5条短期快照。
还可以进一步优化信任值逻辑:当同一个用户连续3轮触发唤醒词,且智能体的响应准确率≥95%,系统会自动把这个用户的画像置为“高信任等级”,并将向量检索阈值放宽到0.62。这样后续的画像检索会更灵敏。
测试时,直接在用户输入中嵌入触发词组合,比如“还记得我吗?我是老用户,用过三年”。观察智能体是否调出了历史的工单编号或偏好模板。如果没有响应,检查触发词是否被过滤——常见的问题包括输入中夹杂了表情符号、全角空格或URL链接,这些元素会导致关键词匹配失败。
把这五个环节都走通,智能体的“记忆体系”才算真正成型。它不再是那种聊三句忘一句的“金鱼脑”,而是一个能持续理解用户、记住用户、服务用户的成熟助手。这才是智能体该有的样子。
