艾体宝洞察什么是真正的上下文及为何需要它

时间：2026-06-18 16:42

企业AI进入Agent时代，但生产环境中Agent常出现“失智”行为，根因在于缺乏完整业务上下文。Arango提出ContextualDataLayer，基于图模型构建统一、实时、可信的业务上下文，使Agent共享同一语义层，从RAG转向上下文工程，实现可靠决策与行动。

进入2025年以后，绝大多数企业的AI项目正加速迈入Agent时代。

企业不再满足于只会简单问答的聊天机器人。他们真正期盼的是能自主行动的智能体：能够自动识别并排查系统故障、自动处理工单并分派工程师、自动跟进客户并预估成单概率、自动执行跨部门业务流程，甚至基于实时业务状态做出运营决策。

然而，从演示走向实际生产部署，几乎每一步都会遇到意想不到的挑战。很多团队发现，Agent在演示环境中表现得机智灵活，可一旦接入真实的企业系统，便开始出现各种“失智”行为：回答看似正确，却与实际业务价值毫无关联；推理过程漏洞百出，关键因果链条缺失；多步骤任务执行到中途突然“失忆”；给出违背公司经营常理的业务建议；不同Agent同时得出相互冲突的结论，让业务部门彻底失去信任。

面对这些问题，许多团队的第一反应是将问题归咎于模型：“GPT还是不够强。”“Claude的推理能力太弱。”“DeepSeek的幻觉太严重。”但在Arango的观察中，核心问题根本不在于模型。关键在于——企业始终未能真正为Agent提供可用的业务上下文。

一个真实的企业级错误：500错误与消失的上下文

假设你是一家大型电商平台的技术负责人。凌晨两点，报警电话骤然响起：用户支付失败率突然飙升。你被紧急拉入线上会议，所有人都在等待结论。你打开运维助手，输入了一行指令：“为什么支付失败？”

Agent快速检索了最近15分钟的日志，给出了答案：“支付服务返回500错误，建议重启支付服务实例。”

从语言层面看，这个回答无可挑剔。它准确捕获了日志中的异常信号，表达了正确的技术判断。但从业务层面看，这个回答几乎没有价值——甚至可能构成危险的误导。

因为真正的问题根源是一条完整的因果链：

22:03 Redis集群发生节点重启→连接池瞬间被耗尽→大量订单服务调用超时→支付服务调用失败→支付网关出现500错误→用户端订单支付失败

500错误只是整条链路的末端结果，而Redis节点重启才是真正的根因。如果不恢复Redis容量或调整连接池配置，即便重启支付服务一百次，故障依然存在。

那为什么Agent未能发现根因？因为它看到的，是孤立、扁平的日志片段，而非还原后的完整业务上下文。它不知道支付服务依赖于Redis，不清楚Redis集群的变更历史，也无法理解当晚发生的所有关联事件之间的因果网络。这就是问题的本质：Agent拥有数据，却缺少上下文。

RAG的局限：当“找文档”不再够用

过去两年，行业中最主流的解决方案是RAG（检索增强生成），其架构简单直接：用户提问→Embedding向量化→向量库语义检索→找到最相关的文档片段→交给LLM生成回答。

这种模式对于知识问答型场景非常有效。比如：“公司最新的报销流程是什么？”“OAuth2授权码模式是如何工作的？”“产品A和产品B的功能差异在哪里？”这些问题的答案，天然封装在现有的文档、手册和规范之中。它们本质上是在查找知识。

但企业环境里最关键的决策问题，极少是单纯的知识问答，绝大多数是企业运营中至关重要的关系分析与因果关系推断。例如：“支付为什么突然失败？”（这是事件与组件之间的因果链问题）“哪些客户最有可能在30天内续约？”（这是客户行为与产品使用之间的关联问题）“这次发布的风险究竟在哪里？”（这是变更、依赖和业务影响之间的影响面问题）“哪个供应商是我们的单点风险？”（这是供应链节点与依赖度的网络问题）

回答这些问题，需要理解的远不止某一篇文档，而是：实体与实体之间的关联（客户、产品、合同、团队、系统）；事件与事件之间的时序与因果（发布、变更、告警、工单）；组织与组织之间的影响范围（部门、权限、流程、SLA）。而这些关系，往往不完整地存在于任何一份单一的文档、表格或日志中。它们是跨系统、跨模态、跨时间的碎片化信息。

企业数据的原罪：上下文碎片化

Arango在其Contextual Data Platform中反复强调一个无法回避的现实：企业数据天然是高度碎片化的。一个所谓的“客户360视图”背后，可能是支离破碎的数据结构：CRM中记录了客户联系人、阶段、最后沟通时间；ERP中存有应收账款、历史订单、信用额度；邮件系统里包含最近三周的报价沟通记录；客服系统里有正在处理的投诉与工单；工单系统中有关联的P1故障及其处理人员；合同系统里存有即将到期的合同与续约条款；知识库里是该客户所在行业的最佳实践案例。

对于经验丰富的人类员工，他们天生具备“上下文拼接”能力：接到客户电话时，脑海中会自动融合投诉历史、付款状态、合同条款和最近接触记录，从而做出合理判断。但Agent不具备这种跨越系统边界的“自动拼接”能力。绝大多数情况下，它被限定在某个系统或某类数据切片内，看到的永远是局部真相。

这也就是为什么，销售Agent可能会根据“客户上周反复打开报价单”这一信号，果断建议：“立刻安排高层拜访，重点推进签约。”从销售漏斗数据来看，这个判断并无毛病。但从企业全局来看，可能完全错误。因为同一时刻，财务系统已经标记该客户存在严重逾期未付款，客服系统显示多个产品缺陷投诉未被处理，法务系统指出该客户存在合同违约风险。销售Agent的判断是准确的，但业务结论却是灾难性的。缺少上下文，就等于缺少判断力。

什么才是真正的“上下文”？

一个普遍的误解是：上下文等于更多文档。似乎只要把PDF、Wiki和邮件都向量化，Agent就自然获得了上下文。但这恰恰是RAG思维最大的盲区。

Arango对“上下文”的定义，更接近一个核心概念：业务上下文（Business Context），即业务运行过程中自然产生的、所有相互关联的、动态变化的信息集合。它既包括传统的非结构化知识：文档、PDF、Wiki页面、邮件正文；更包括结构化的、动态的、彼此勾连的业务要素：用户、客户、供应商；产品、SKU、订单；服务、微服务、基础设施组件；事件、告警、变更、发布；流程、审批、工单流转；权限、角色、组织架构；实时状态（库存、在线、健康度）。

但仅有要素本身还不够。真正的上下文是这些要素之间的关联及其动态演化，例如：客户A签订合同B，关联产品订阅C，部署在环境D，产生工单E，分配给运维工程师F，隶属于支持团队G。当这些关联被完整地连接起来，Agent从“客户A投诉”这一事件中获得的就不再是孤立的投诉记录，而是可以沿着图游走的丰富上下文：合同等级、产品依赖、环境健康度、工单历史、责任人忙闲度。上下文不是信息的简单堆叠，而是信息之间的连接与深层意义。

Arango将其核心目标概括为三个词：统一的、实时的、可信的业务上下文。统一，意味着跨系统打破数据孤岛，以同一个语义层表达；实时，意味着不依赖离线批处理，而是持续捕获变化并更新关联；可信，意味着来源清晰、血缘完整、权限受控，每一步推理都可追溯。

为什么Agent天生依赖上下文层？

Agent与ChatBot的本质区别，不在于模型强弱，而在于行动还是回答。ChatBot的输出是信息，而Agent的输出是决策和行动。任何一个负责任的行动，都必须建立在完整、新鲜、可信的上下文基础之上。

举个例子，用户对智能助理说：“帮我安排下周去纽约出差，顺便见一下客户。”这句话的语义虽然清晰，但信息量严重不足。要真正完成这个动作，Agent至少还需要掌握：这个用户是谁？当前职位和权限如何？下周哪几天有空？是否有不可移动的日程？纽约要见的客户是什么级别？最近三次沟通的内容和情绪状态？公司差旅政策是什么？预算上限、舱位标准、审批流程如何？用户本人的出行偏好是什么？该客户是否存在未解决的严重问题，此时拜访是否合适？

这些信息分散在日历系统、CRM、邮件记录、HR系统、差旅平台和业务沟通工具中。任何一条的缺失，都可能让执行结果陷入尴尬甚至带来商业损失。

传统做法是，Agent每接到一个任务，便临时到各系统去检索、提取、拼装上下文。Arango将这种现象称为“推理时上下文重建”。这种方法存在三个根本性缺陷：

第一，速度慢。每次推理都需要跨多个异构系统进行数据检索与聚合，涉及API调用、权限检查、数据格式转换，延迟极高，在需要快速响应的生产环境中完全不现实。

第二，不一致。不同的Agent、同一Agent的不同调用，由于时序差异、数据更新滞后或查询路径不同，可能拿到完全不同的上下文视图。这直接导致开头所说的“不同Agent得出相互矛盾结论”的混乱局面。

第三，不可解释。当Agent做出一个错误决策，团队回溯时发现，它使用的上下文是“临时拼凑”出来的，没有完整的血缘和版本记录，完全无法确定是模型错、数据错还是拼装逻辑错。

因此，要让Agent在真实企业环境中持续可靠地行动，必须把上下文从“临时制品”升级为持续维护的基础设施。

解法：Contextual Data Layer——提前构建的业务语义层

Arango给出的方案非常直接：不要在推理时重建上下文，而应该提前构建上下文，并以API的形式持续供给。这就是Contextual Data Layer（上下文数据层）的核心思想。

架构对比十分明显：传统RAG模式是数据源→向量化→检索片段→LLM；上下文层模式则是各类业务数据源→Contextual Data Layer（持续同步、实时建模）→Agent（获取完整上下文）→LLM（推理与行动）。

Contextual Data Layer并不取代数据源，而是在数据源之上，持续维护一个活跃的企业业务上下文图谱，其中包含：实体（客户、产品、合同、系统、人员、事件）；关系（依赖、所属、影响、版本、沟通、交易）；状态（在线状态、库存量、运行健康状况、审批节点）；事件流（变更记录、告警通知、用户行为）；规则与权限（谁有权看到什么，什么操作受什么策略约束）。这使得所有Agent不再各自为战地去理解企业，而是共享同一个统一、实时、可信的业务语义层。

为什么是图模型？上下文的内核是关系网络

很多人会问：用关系数据库、宽表或者更强大的向量库，能不能完成这个任务？答案是：局部可以，整体不能。因为上下文的本质，不是一张二维表上的属性字段，而是高度互联的关系网络。回到支付故障的例子：支付服务依赖Redis集群，Redis集群部署于服务器Node-42，关联最近变更记录#12901，触发告警事件Alert-3344，负责运维团队SRE-Payments，团队包含成员张×、李×。

这个结构天然就是图。如果强行用宽表去表达，要么产生可怕的连接查询和性能瓶颈，要么丢失关系之间的多层依赖，最终给Agent的还是“变形的碎片”。Arango之所以选择图作为核心模型，正是因为图是表达“企业脉络”最高效、最自然的方式。与此同时，Arango并没有抛弃文档、键值、全文检索等多模型能力，而是以图作为骨架，把不同模型的能力有机融合在一个引擎里。

更关键的是，企业现在不必再手工维护一副巨大而昂贵的企业知识图谱。Arango推出的AutoGraph技术，可以直接从现有业务数据中自动构建Context Graph：自动识别实体（通过规则、模式匹配、元数据）；自动推断关系（外键、引用、命名规范、事件关联）；自动发现依赖链路和服务拓扑；自动注入业务语义，并保持增量更新。最终，这个图不是某个部门的一次性项目成果，而是一个持续自更新的、活的上下文网络，可随时被Agent查询和遍历。

举个更具业务冲击力的例子：供应链风险。当一个地区的二级供应商出现合规问题，Context Graph可以实时沿着“部件→组件→产品→客户合同”的路径，一键识别出所有受影响的高价值客户合同，并触发主动响应。这种全局冲击分析，离开图几乎无法实时完成。

从RAG时代到Context Engineering时代

过去几年，整个行业的注意力被Prompt Engineering吸引，紧接着是RAG Engineering的狂热。大家反复琢磨如何写出更精妙的提示词、如何调优分块策略、如何改进向量相似度。而Arango点出了下一波真正的分水岭：Context Engineering（上下文工程）。

核心问题已经发生根本迁移：不再问“如何让模型更聪明？”而是问“如何让模型获得正确的、完整的、可信的业务上下文？”因为当模型能力日趋同质化，Agent的竞争力不会来自模型参数的数量，而是来自上下文的质量。谁能够率先把散落在文档、数据库、事件流、业务规则和实时状态中的所有碎片，连接成一个统一、实时、可信的Contextual Data Layer，谁才能真正构建出经得起生产环境考验的Enterprise Agent。

这就是为什么Arango不再仅仅把自己定位为一家多模型数据库公司，而是开始重新定义自己为：“The Context Layer for Enterprise AI”——企业AI的上下文层。在这个新的时代叙事里，上下文不再是AI的辅助信息，不再是临时拼凑的检索片段，而是新的基础设施本身。

结语：把上下文当作第一要素

要让Agent不再“犯蠢”，靠的从来不是等待下一版更强的模型。真正重要的是，从现在开始，把上下文当作企业AI体系中的第一要素——提前构建、统一治理、实时演进。当你拥有一个能够持续连接企业所有业务要素的上下文层时，Agent看到的就不再是碎片化的日志、文档或表格，而是一个活的、可供推理的商业世界。从那一刻起，它才开始真正变得聪明。

来源：https://cloud.tencent.com.cn/developer/article/2693116

机器人