游乐游手机版
首页/AI教程/文章详情

艾体宝洞察什么是真正的上下文及为何需要它

时间:2026-06-18 16:42
企业AI进入Agent时代,但生产环境中Agent常出现“失智”行为,根因在于缺乏完整业务上下文。Arango提出ContextualDataLayer,基于图模型构建统一、实时、可信的业务上下文,使Agent共享同一语义层,从RAG转向上下文工程,实现可靠决策与行动。

进入2025年以后,绝大多数企业的AI项目正加速迈入Agent时代。

企业不再满足于只会简单问答的聊天机器人。他们真正期盼的是能自主行动的智能体:能够自动识别并排查系统故障、自动处理工单并分派工程师、自动跟进客户并预估成单概率、自动执行跨部门业务流程,甚至基于实时业务状态做出运营决策。

然而,从演示走向实际生产部署,几乎每一步都会遇到意想不到的挑战。很多团队发现,Agent在演示环境中表现得机智灵活,可一旦接入真实的企业系统,便开始出现各种“失智”行为:回答看似正确,却与实际业务价值毫无关联;推理过程漏洞百出,关键因果链条缺失;多步骤任务执行到中途突然“失忆”;给出违背公司经营常理的业务建议;不同Agent同时得出相互冲突的结论,让业务部门彻底失去信任。

面对这些问题,许多团队的第一反应是将问题归咎于模型:“GPT还是不够强。”“Claude的推理能力太弱。”“DeepSeek的幻觉太严重。”但在Arango的观察中,核心问题根本不在于模型。关键在于——企业始终未能真正为Agent提供可用的业务上下文。

一个真实的企业级错误:500错误与消失的上下文

假设你是一家大型电商平台的技术负责人。凌晨两点,报警电话骤然响起:用户支付失败率突然飙升。你被紧急拉入线上会议,所有人都在等待结论。你打开运维助手,输入了一行指令:“为什么支付失败?”

Agent快速检索了最近15分钟的日志,给出了答案:“支付服务返回500错误,建议重启支付服务实例。”

从语言层面看,这个回答无可挑剔。它准确捕获了日志中的异常信号,表达了正确的技术判断。但从业务层面看,这个回答几乎没有价值——甚至可能构成危险的误导。

因为真正的问题根源是一条完整的因果链:

22:03 Redis集群发生节点重启→连接池瞬间被耗尽→大量订单服务调用超时→支付服务调用失败→支付网关出现500错误→用户端订单支付失败

500错误只是整条链路的末端结果,而Redis节点重启才是真正的根因。如果不恢复Redis容量或调整连接池配置,即便重启支付服务一百次,故障依然存在。

那为什么Agent未能发现根因?因为它看到的,是孤立、扁平的日志片段,而非还原后的完整业务上下文。它不知道支付服务依赖于Redis,不清楚Redis集群的变更历史,也无法理解当晚发生的所有关联事件之间的因果网络。这就是问题的本质:Agent拥有数据,却缺少上下文。

RAG的局限:当“找文档”不再够用

过去两年,行业中最主流的解决方案是RAG(检索增强生成),其架构简单直接:用户提问→Embedding向量化→向量库语义检索→找到最相关的文档片段→交给LLM生成回答。

这种模式对于知识问答型场景非常有效。比如:“公司最新的报销流程是什么?”“OAuth2授权码模式是如何工作的?”“产品A和产品B的功能差异在哪里?”这些问题的答案,天然封装在现有的文档、手册和规范之中。它们本质上是在查找知识。

但企业环境里最关键的决策问题,极少是单纯的知识问答,绝大多数是企业运营中至关重要的关系分析与因果关系推断。例如:“支付为什么突然失败?”(这是事件与组件之间的因果链问题)“哪些客户最有可能在30天内续约?”(这是客户行为与产品使用之间的关联问题)“这次发布的风险究竟在哪里?”(这是变更、依赖和业务影响之间的影响面问题)“哪个供应商是我们的单点风险?”(这是供应链节点与依赖度的网络问题)

回答这些问题,需要理解的远不止某一篇文档,而是:实体与实体之间的关联(客户、产品、合同、团队、系统);事件与事件之间的时序与因果(发布、变更、告警、工单);组织与组织之间的影响范围(部门、权限、流程、SLA)。而这些关系,往往不完整地存在于任何一份单一的文档、表格或日志中。它们是跨系统、跨模态、跨时间的碎片化信息。

企业数据的原罪:上下文碎片化

Arango在其Contextual Data Platform中反复强调一个无法回避的现实:企业数据天然是高度碎片化的。一个所谓的“客户360视图”背后,可能是支离破碎的数据结构:CRM中记录了客户联系人、阶段、最后沟通时间;ERP中存有应收账款、历史订单、信用额度;邮件系统里包含最近三周的报价沟通记录;客服系统里有正在处理的投诉与工单;工单系统中有关联的P1故障及其处理人员;合同系统里存有即将到期的合同与续约条款;知识库里是该客户所在行业的最佳实践案例。

对于经验丰富的人类员工,他们天生具备“上下文拼接”能力:接到客户电话时,脑海中会自动融合投诉历史、付款状态、合同条款和最近接触记录,从而做出合理判断。但Agent不具备这种跨越系统边界的“自动拼接”能力。绝大多数情况下,它被限定在某个系统或某类数据切片内,看到的永远是局部真相。

这也就是为什么,销售Agent可能会根据“客户上周反复打开报价单”这一信号,果断建议:“立刻安排高层拜访,重点推进签约。”从销售漏斗数据来看,这个判断并无毛病。但从企业全局来看,可能完全错误。因为同一时刻,财务系统已经标记该客户存在严重逾期未付款,客服系统显示多个产品缺陷投诉未被处理,法务系统指出该客户存在合同违约风险。销售Agent的判断是准确的,但业务结论却是灾难性的。缺少上下文,就等于缺少判断力。

什么才是真正的“上下文”?

一个普遍的误解是:上下文等于更多文档。似乎只要把PDF、Wiki和邮件都向量化,Agent就自然获得了上下文。但这恰恰是RAG思维最大的盲区。

Arango对“上下文”的定义,更接近一个核心概念:业务上下文(Business Context),即业务运行过程中自然产生的、所有相互关联的、动态变化的信息集合。它既包括传统的非结构化知识:文档、PDF、Wiki页面、邮件正文;更包括结构化的、动态的、彼此勾连的业务要素:用户、客户、供应商;产品、SKU、订单;服务、微服务、基础设施组件;事件、告警、变更、发布;流程、审批、工单流转;权限、角色、组织架构;实时状态(库存、在线、健康度)。

但仅有要素本身还不够。真正的上下文是这些要素之间的关联及其动态演化,例如:客户A签订合同B,关联产品订阅C,部署在环境D,产生工单E,分配给运维工程师F,隶属于支持团队G。当这些关联被完整地连接起来,Agent从“客户A投诉”这一事件中获得的就不再是孤立的投诉记录,而是可以沿着图游走的丰富上下文:合同等级、产品依赖、环境健康度、工单历史、责任人忙闲度。上下文不是信息的简单堆叠,而是信息之间的连接与深层意义。

Arango将其核心目标概括为三个词:统一的、实时的、可信的业务上下文。统一,意味着跨系统打破数据孤岛,以同一个语义层表达;实时,意味着不依赖离线批处理,而是持续捕获变化并更新关联;可信,意味着来源清晰、血缘完整、权限受控,每一步推理都可追溯。

为什么Agent天生依赖上下文层?

Agent与ChatBot的本质区别,不在于模型强弱,而在于行动还是回答。ChatBot的输出是信息,而Agent的输出是决策和行动。任何一个负责任的行动,都必须建立在完整、新鲜、可信的上下文基础之上。

举个例子,用户对智能助理说:“帮我安排下周去纽约出差,顺便见一下客户。”这句话的语义虽然清晰,但信息量严重不足。要真正完成这个动作,Agent至少还需要掌握:这个用户是谁?当前职位和权限如何?下周哪几天有空?是否有不可移动的日程?纽约要见的客户是什么级别?最近三次沟通的内容和情绪状态?公司差旅政策是什么?预算上限、舱位标准、审批流程如何?用户本人的出行偏好是什么?该客户是否存在未解决的严重问题,此时拜访是否合适?

这些信息分散在日历系统、CRM、邮件记录、HR系统、差旅平台和业务沟通工具中。任何一条的缺失,都可能让执行结果陷入尴尬甚至带来商业损失。

传统做法是,Agent每接到一个任务,便临时到各系统去检索、提取、拼装上下文。Arango将这种现象称为“推理时上下文重建”。这种方法存在三个根本性缺陷:

第一,速度慢。每次推理都需要跨多个异构系统进行数据检索与聚合,涉及API调用、权限检查、数据格式转换,延迟极高,在需要快速响应的生产环境中完全不现实。

第二,不一致。不同的Agent、同一Agent的不同调用,由于时序差异、数据更新滞后或查询路径不同,可能拿到完全不同的上下文视图。这直接导致开头所说的“不同Agent得出相互矛盾结论”的混乱局面。

第三,不可解释。当Agent做出一个错误决策,团队回溯时发现,它使用的上下文是“临时拼凑”出来的,没有完整的血缘和版本记录,完全无法确定是模型错、数据错还是拼装逻辑错。

因此,要让Agent在真实企业环境中持续可靠地行动,必须把上下文从“临时制品”升级为持续维护的基础设施。

解法:Contextual Data Layer——提前构建的业务语义层

Arango给出的方案非常直接:不要在推理时重建上下文,而应该提前构建上下文,并以API的形式持续供给。这就是Contextual Data Layer(上下文数据层)的核心思想。

架构对比十分明显:传统RAG模式是数据源→向量化→检索片段→LLM;上下文层模式则是各类业务数据源→Contextual Data Layer(持续同步、实时建模)→Agent(获取完整上下文)→LLM(推理与行动)。

Contextual Data Layer并不取代数据源,而是在数据源之上,持续维护一个活跃的企业业务上下文图谱,其中包含:实体(客户、产品、合同、系统、人员、事件);关系(依赖、所属、影响、版本、沟通、交易);状态(在线状态、库存量、运行健康状况、审批节点);事件流(变更记录、告警通知、用户行为);规则与权限(谁有权看到什么,什么操作受什么策略约束)。这使得所有Agent不再各自为战地去理解企业,而是共享同一个统一、实时、可信的业务语义层。

为什么是图模型?上下文的内核是关系网络

很多人会问:用关系数据库、宽表或者更强大的向量库,能不能完成这个任务?答案是:局部可以,整体不能。因为上下文的本质,不是一张二维表上的属性字段,而是高度互联的关系网络。回到支付故障的例子:支付服务依赖Redis集群,Redis集群部署于服务器Node-42,关联最近变更记录#12901,触发告警事件Alert-3344,负责运维团队SRE-Payments,团队包含成员张×、李×。

这个结构天然就是图。如果强行用宽表去表达,要么产生可怕的连接查询和性能瓶颈,要么丢失关系之间的多层依赖,最终给Agent的还是“变形的碎片”。Arango之所以选择图作为核心模型,正是因为图是表达“企业脉络”最高效、最自然的方式。与此同时,Arango并没有抛弃文档、键值、全文检索等多模型能力,而是以图作为骨架,把不同模型的能力有机融合在一个引擎里。

更关键的是,企业现在不必再手工维护一副巨大而昂贵的企业知识图谱。Arango推出的AutoGraph技术,可以直接从现有业务数据中自动构建Context Graph:自动识别实体(通过规则、模式匹配、元数据);自动推断关系(外键、引用、命名规范、事件关联);自动发现依赖链路和服务拓扑;自动注入业务语义,并保持增量更新。最终,这个图不是某个部门的一次性项目成果,而是一个持续自更新的、活的上下文网络,可随时被Agent查询和遍历。

举个更具业务冲击力的例子:供应链风险。当一个地区的二级供应商出现合规问题,Context Graph可以实时沿着“部件→组件→产品→客户合同”的路径,一键识别出所有受影响的高价值客户合同,并触发主动响应。这种全局冲击分析,离开图几乎无法实时完成。

从RAG时代到Context Engineering时代

过去几年,整个行业的注意力被Prompt Engineering吸引,紧接着是RAG Engineering的狂热。大家反复琢磨如何写出更精妙的提示词、如何调优分块策略、如何改进向量相似度。而Arango点出了下一波真正的分水岭:Context Engineering(上下文工程)。

核心问题已经发生根本迁移:不再问“如何让模型更聪明?”而是问“如何让模型获得正确的、完整的、可信的业务上下文?”因为当模型能力日趋同质化,Agent的竞争力不会来自模型参数的数量,而是来自上下文的质量。谁能够率先把散落在文档、数据库、事件流、业务规则和实时状态中的所有碎片,连接成一个统一、实时、可信的Contextual Data Layer,谁才能真正构建出经得起生产环境考验的Enterprise Agent。

这就是为什么Arango不再仅仅把自己定位为一家多模型数据库公司,而是开始重新定义自己为:“The Context Layer for Enterprise AI”——企业AI的上下文层。在这个新的时代叙事里,上下文不再是AI的辅助信息,不再是临时拼凑的检索片段,而是新的基础设施本身。

结语:把上下文当作第一要素

要让Agent不再“犯蠢”,靠的从来不是等待下一版更强的模型。真正重要的是,从现在开始,把上下文当作企业AI体系中的第一要素——提前构建、统一治理、实时演进。当你拥有一个能够持续连接企业所有业务要素的上下文层时,Agent看到的就不再是碎片化的日志、文档或表格,而是一个活的、可供推理的商业世界。从那一刻起,它才开始真正变得聪明。

来源:https://cloud.tencent.com.cn/developer/article/2693116
上一篇YC CEO开源AI记忆引擎mem0,正则替代LLM构建知识图谱 下一篇别再纠结选AI GPT5.5 Claude Gemini DeepSeek多模型分工实战指南
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
微软Copilot插件安装全流程:浏览器与扩展市场配置
AI教程 · 2026-07-01

微软Copilot插件安装全流程:浏览器与扩展市场配置

围绕MicrosoftCopilot在浏览器、编辑器和扩展市场中的安装与配置,梳理账号准备、安装步骤、权限检查、常见故障及安全使用边界,适合新手快速完成AI办公工具部署。

Microsoft Copilot Docker 一键部署指南:镜像拉取、端口映射与数据目录配置
AI教程 · 2026-07-01

Microsoft Copilot Docker 一键部署指南:镜像拉取、端口映射与数据目录配置

围绕Copilot类AI办公工具的Docker部署流程,说明镜像选择、拉取校验、端口映射、数据目录挂载、环境变量配置、更新回滚与常见故障处理。

微软Copilot API密钥注册获取与国内网络配置
AI教程 · 2026-07-01

微软Copilot API密钥注册获取与国内网络配置

围绕MicrosoftCopilot相关接口接入流程,梳理账号准备、Azure资源创建、密钥获取、环境变量配置、国内网络连通性优化、常见报错处理与安全管理要点。

微软Copilot Linux部署:环境准备到后台运行全流程
AI教程 · 2026-07-01

微软Copilot Linux部署:环境准备到后台运行全流程

MicrosoftCopilot不适合按本地模型方式安装,Linux服务器更常见的是部署企业入口或集成服务。流程需完成账号授权、运行环境、服务配置、反向代理、进程守护与日志监控,并注意数据权限、访问控制和合规边界。

Microsoft Copilot macOS安装教程:Apple Silicon与Intel配置步骤
AI教程 · 2026-07-01

Microsoft Copilot macOS安装教程:Apple Silicon与Intel配置步骤

MicrosoftCopilot在Mac上可通过网页应用、Edge侧边栏或Microsoft365组件使用,AppleSilicon与Intel机型重点在系统版本、浏览器、账号授权和隐私设置。