先说一个核心判断:HVAC-Diagnostic-Brain(简称HDB)这款产品的定位,本质上就是暖通空调领域的一位“AI医生”。
它的主战场是大型商业楼宇和工业厂房的空调系统维保场景。能够听懂维修工那些口语化的报修描述——比如“机子喘得厉害”——然后结合物理定律与AI推理,精准锁定制冷机组这类复杂设备的故障根因。更关键的是,它还能自动规划出长达10步以上的排查逻辑链,并按照概率排序给出最优维修方案。最后,系统会强制校验安全红线,杜绝任何“幻觉”带来的风险。
这套流程,让复杂的维修工作变得像跟着导航开车一样:简单、专业且安全。

四层解耦架构
1. 数据层
在Neo4j图数据库中,知识的存储方式与传统做法截然不同。它不再以孤立的“主谓宾”三元组形式存在,而是以决策树路径的方式组织。节点方面做了扩展,包含了:
- Symptom (现象):例如“高压报警”。
- CheckState (检测中间态):例如“冷凝器压力值”。
- Fault (故障根因):例如“冷凝器结垢”。
- Operation (维修动作):例如“化学清洗”。
关系层面也做了增强,带上了属性:
- [FOLLOWED_BY {condition: “>2.5MPa”, prob: 0.8}]:这定义了10步链条中的跳转逻辑与可能性。
- [PREREQUISITE]:硬性约束。一个典型的例子是,拆机之前必须先断电。
2. 逻辑层
这里引入了概率路径算法。路径检索不再依赖向量相似度,而是使用Cypher语言的深度遍历算法。概率计算方面,引入了贝叶斯链条。例如,如果A→B的概率是0.8,且B→C的概率是0.7,那么整条路径A→C的置信度就是0.56。更巧妙的是剪枝逻辑:当用户反馈某个检查点为“正常”时,硬逻辑会自动剔除所有基于“异常”分支的后续路径,避免无效引导。
3. 智能体协作层
这一层对现有的知识图谱RAG中的四个智能体进行了重构,形成了一个分工明确的协作团队:
- 分诊专家 (Triage Agent):负责将用户的模糊口语转化为图谱中的标准Symptom。
- 路径规划员 (Path Planner):根据当前状态,从Neo4j中提取出前3条最可能的“10步诊断链”。
- 交互引导员 (Interviewer Agent):负责执行10步链路中的“中间询问”,比如“请观察室外机风机是否转动?”
- 安全合规官 (Safety Guard):负责用SHACL规则校验生成的维修方案是否包含了所有必须的安全步骤。
4. 交互层
这里引入了诊断会话机制。系统会记录用户已经做到了第几步,当前处于路径的哪个分支,确保整个诊断过程有据可查、不跑偏。

数据流图
HDB本质上是一个受约束的、带记忆的、可自我进化的逻辑推演引擎。
1. 分诊对齐 (P1)
输入:维修工的口语,例如“机子喘得厉害”。处理:软本体Agent利用语义理解,将其对齐为图谱中的标准节点Symptom: Surging。
2. 路径挖掘 (P2)
这是一个深度优先遍历过程。它从Symptom出发,在Neo4j中寻找长度最高可达10到15跳的LEADS_TO路径,直到终点Action。
3. 推理与剪枝 (P3)
核心逻辑是两件事:概率计算——沿着10步路径累乘概率,算出置信度最高的Top-N路径;硬逻辑剪枝——如果路径A假设“压力高”,但外部传感数据或用户反馈显示“压力正常”,则P3直接剔除该路径,提前止损。
4. 交互反馈循环
这是一个状态机循环。系统每推送1到2个检查步骤,都会要求用户反馈结果(DS3会话状态)。用户反馈回传给P1,触发P3重新计算路径置信度,实现动态导引。
5. 安全围栏 (P4)
这是混合本体中“刚性”的体现。在方案离开系统前,SHACL引擎强制检查是否包含特定的安全动作,不合规就拦截并报错。
6. 学习进化
当维修完成后,如果人员反馈“按此方案修好了”,这条绿色数据流就会流向DS1知识图谱,自动调高该路径上相关边的probability权重值。

执行流程场景模拟
0. 初始输入:“中央空调主机运行10分钟后自动停机,显示屏闪烁,没有报错代码。”
1. 理解与对齐 (Step 1-2):Agent A识别出两个现象:Unexpected_Shutdown 和 No_Error_Code。检索图谱后发现3条长路径,其中概率最高的一条涉及12个步骤。
2. 交互式诊断 (Step 3-6):系统不会直接丢出方案,而是开始引导。“第3步:请触摸压缩机外壳,是否烫手?”用户回答:“非常烫。”概率随即更新:路径“过载保护”概率从0.4升至0.9,而“电路板故障”概率则因逻辑剪枝降至0.05。
3. 深度下钻 (Step 7-9):系统继续引导:“第7步:请测量启动电容的电容量。”用户反馈数值后,硬逻辑校验发现该数值低于标准限值20%,与故障定义吻合。
4. 方案输出 (Step 10):系统生成最终方案:“更换启动电容”。在方案离开系统前,SHACL强制介入,自动在末尾添加安全提示:“注意:更换前请确保放电,防止电击”。

五大核心技术难点
说实话,HDB项目最难啃的骨头,是知识的结构化治理。把1000本PDF变成1000万个三元组很容易,但要把它们变成一条条互不冲突、逻辑连贯、可计算概率的维修链,那需要极强的本体设计能力。
1. 逻辑链的语义漂移与误差累积
难点描述:在10步的推理中,如果每一步的语义对齐准确率是90%,那么到了第10步,整体准确率会衰减到35%。技术瓶颈:LLM在处理长链条时容易受到中间步骤幻觉的干扰。解决难度:⭐⭐⭐⭐⭐解决方案:必须引入逻辑剪枝。每一步的输出必须经过硬本体的约束校验,一旦发现不符合物理定律——比如在低压保护时却要求检查高压开关——就立即强制截断并重算,不能让LLM继续往下“瞎猜”。
2. 知识建模:从非标文本到逻辑有向无环图
难点描述:厂家手册、FMEA表格和维修日志的格式极其不统一。手册里写着“若A发生则检查B”,但实际操作中可能包含隐含的前置条件。技术瓶颈:如何自动从非结构化文本中提取出带有“If-Then-Else”逻辑的图结构?解决难度:⭐⭐⭐⭐解决方案:需要一个“本体审计智能体”。先由Radical Agent提取初稿,再由专门负责逻辑对齐的智能体对照《暖通标准术语库》进行实体消歧,确保“冷媒不足”和“氟利昂不够”在图谱中被强制归并为一个逻辑节点。
3. 动态概率权重的获取与冷启动
难点描述:维修方案中的概率往往没有现成数据,手册里通常只给出列表,不给概率。技术瓶颈:初始概率从哪儿来?如何随实际维修结果动态更新?解决难度:⭐⭐⭐⭐解决方案:冷启动阶段,利用LLM的先验知识给出初始概率排名。运行阶段,引入强化学习反馈。维修人员反馈“修好了”或“没修好”,系统自动利用贝叶斯公式更新边上的权重。
4. 长时记忆管理
难点描述:10步维修可能跨越数小时甚至数天。传统的LLM对话窗口无法稳固地维持这种深度诊断状态。技术瓶颈:当用户在第8步突然说“等等,我刚才看错了,第3步那个压力表其实是红区”,系统如何实现逻辑回溯?解决难度:⭐⭐⭐⭐解决方案:引入外部状态机管理。诊断过程不放在LLM的记忆里,而是存在Neo4j的Session节点或md文件中。LLM只作为处理器,每一轮对话都从数据库读取当前的诊断快照和已排除路径。
5. 符号推理与神经推理的时序对齐
难点描述:硬本体的符号推理是刚性的,LLM的神经推理是柔性的。技术瓶颈:当LLM认为“根据经验,可能是电路板潮湿”,但硬本体查询显示“该机组安装在干燥机房,湿度传感器显示正常”时,系统如何仲裁冲突?解决难度:⭐⭐⭐⭐解决方案:设定“硬规则”具有最高优先级的“一票否决权”。在HDB架构中,安全合规Agent使用SHACL形状约束,拥有比分诊专家Agent更高的权限。任何违反物理约束的建议将被系统自动拦截并打回重审。

神经符号架构
HDB最核心的创新,是将软本体和硬本体融合成了神经符号架构。负责语义理解的软本体是神经部分,记录在md文件中,它决定了系统知识面的广度;负责逻辑推理的硬本体是符号部分,由程序实现,它决定了系统专业性的下限和在严肃场景中的安全性。
软本体
本质:一份用自然语言编写的领域规则和行动指南。载体:Global_HVACR_Ontology_Policy.md交互对象:大语言模型核心功能:语义对齐、知识抽取指引、上下文理解、模糊处理。特点:灵活、有弹性、容错率高、易于编写和修改。
硬本体
本质:一套用数学和代码编写的物理定律和检验脚本。载体:Python脚本、OWL文件、Neo4j约束。交互对象:知识图谱数据库、自动化校验流程。核心功能:逻辑死锁(互斥)、数值熔断、结构校验、自动推理。特点:绝对严谨、零容错、数学可证明、执行效率极高。

双重过滤机制
1. 语义转化阶段:软本体
动作是,LLM带着md规范阅读手册。MD保证了语义的正确性,让LLM能把“风管厚度不少于1.2mm”这句话,按照格式要求转化为初版JSON数据。
2. 逻辑审判阶段:硬本体
结构化JSON进入Python校验脚本。程序根据硬本体定义的规则进行检查。例如,如果AI抽取的风管材料是“彩钢板”,但耐火极限给了“10h”,硬程序会立刻报警,因为这超过了物理极限。如果AI漏掉了来源条款,也会被拦截。
3. 闭环修正阶段
如果硬本体校验失败,结果会反馈给软本体。硬程序给出具体的报错原因,软本体AI收到报错后,重新去md规范和原始文档里找原因,修正输出。最终,只有通过了软理解且符合硬逻辑的数据,才被允许存入Neo4j知识图谱。
