游乐游手机版
首页/AI热点日报/热点详情

大模型业务流程原子化编排在RPA中的应用

类型:热点整理2026-07-04
RPA的开发过程中,有个老问题始终绕不过去——大量重复的业务步骤需要反复编写。这不仅让实施成本居高不下,也拖慢了整体的开发节奏。随着大语言模型(LLM)技术的快速迭代,通过智能体来编排RPA原子业务流程,从而提升这些原子流程的复用度,已经从构想走向了可能。这篇文章将详细拆解RPA业务流程原子化的技术

RPA的开发过程中,有个老问题始终绕不过去——大量重复的业务步骤需要反复编写。这不仅让实施成本居高不下,也拖慢了整体的开发节奏。随着大语言模型(LLM)技术的快速迭代,通过智能体来编排RPA原子业务流程,从而提升这些原子流程的复用度,已经从构想走向了可能。这篇文章将详细拆解RPA业务流程原子化的技术趋势、背后的技术原理,并结合亚信科技AIRPA产品中的技术预研与POC测试,来验证这一技术落地的现实可行性。希望能给关注这一方向的研究者和从业者带来一些实质性的参考。


RPA 的业务编排模式,正在经历从手动编排向智能编排、从基于符号编程向基于LLM编程的转变。利用LLM,我们可以高效地将RPA业务流程拆解成一个个原子化的操作,这些基础操作被抽象出来并融入到提示词中,进而让LLM根据这些基础模块自动规划编排成完整的业务流程,最后通过动作的逻辑顺序来校验整个流程的正确性。


通过严格的技术预研和POC测试,我们发现,基于大模型的业务流程原子化编排技术,特别是采用ProgPrompt+规则限定的方式,让大模型进行智能流程规划并生成RPA流程,确实能够有效辅助业务开发,满足实际需求。


一、技术背景和驱动力


LLM技术的高速发展,使得用它来生成情境机器人的任务规划不再是天方夜谭。不过,在任务规划的过程中,需要为机器人定义并注入大量的领域知识。问题在于,当机器人面对不同的任务领域时,如何高效提供这些差异化的领域知识,就成了制约规划效率的核心瓶颈。


由南加州大学和英伟达联合开发的ProgPrompt方法,恰好提供了一种能够跨越不同情境环境、不同机器人能力和任务的生成提示结构。它的核心思想,是用程序化的提示结构来引导语言模型,让其生成适用于特定情境的机器人任务规划。具体操作是定义一个结构化的提示,里面包含环境中可用的动作、目标以及示例程序。这样一来,语言模型即使没有额外的领域信息,也能根据自然语言指令,生成出一套行动序列。打个比方,ProgPrompt将机器人规划表示成了Python程序,让LLM通过“完成代码”的方式来生成具体的任务规划。


当然,在实际应用中,通过ProgPrompt算法生成的规划,还需要进一步验证其生成的正确性和稳定性——毕竟,靠谱才是硬道理。


二、ProgPrompt 结合 LLM 生成任务规划的技术原理


基于ProgPrompt算法结合LLM来生成任务规划,是整个流程的核心技术环节。其技术原理如下图所示。


图1:基于 ProgPrompt 算法结合 LLM 技术生成任务规划的技术原理


(一)结构化代码创建


首先,按照LLM提示的范例,创建一个结构化的Python代码提示。在这个过程中,ProgPrompt方法会提供包括import语句、目标列表和示例任务在内的内容(在图上标注为PROMPT for planning)。它的巧妙之处在于,用Python中可用的功能来构建提示,以自然语言指令为条件,引导LLM完成代码的生成,进而输出情境机器人的任务规划。


(二)基于 ProgPrompt 的具体目标任务规划


参考代码结构和示例任务后,结合具体的业务场景,就能调整并完成一个针对特定任务目标的规划。在这个环节里,有几个元素会特别突出:提示注释、以目标为参数的导入函数调用操作,以及带有恢复步骤的assertions。其中,代码注释的作用不容小觑——它有助于将高级任务分解成逻辑子任务。这种划分能让LLM用更自然语言的方式表达出自己关于任务和子任务的理解,从而辅助规划。同时,注释还能告知LLM当前目标,有效减少输出结果不连贯、发散或重复的可能性。已有研究表明,类似的中间摘要对于提升LLM在一系列推理任务上的表现非常有效。


(三)执行过程检查


图中标注的PROMPT for state feedback,代表的是示例检查。它主要用于展示程序的执行情况:一个程序语句是成功还是失败,以及生成的规划如何在执行下一步之前纠正错误。右下角则完整展示了整个程序的执行过程,一目了然。


三、生成任务规划技术在 RPA 产品中的应用分析


为了评估并切实推动ProgPrompt算法在亚信科技RPA产品中的应用,RPA产品团队专门组织了一次技术预研,核心目标是支撑RPA任务规划的智能化。我们选择了一个典型的RPA场景,建立了一套完整的技术评估流程,最后通过POC方式筛选出了目前效果最佳的技术路线。


(一)场景选择


这次技术预研的核心,是用ProgPrompt+LLM生成任务规划的技术,来部分替代现有的RPA开发模式,提升开发效率,同时增强RPA原子业务能力的复用性。于是,我们选择了一个非常典型的RPA业务流程——运营商为客户开通“xx固移融合业务”。


该业务的具体流程,如下图2所示。


图2:xx固移融合业务 RPA 开通流程图


进一步梳理这个流程,可以将其拆解为若干个原子能力:


能力1:CBSS 首页通用认证能力

能力2:固网开户套餐选择

能力3:xx固移融合业务套餐开户

能力n:……


这些原子能力能否被高效、准确地生成,并且在后续开发中保持高复用性,直接决定了RPA的开发效率。而基于ProgPrompt的任务规划生成技术,为我们提供了实现这一目标的可能性。当然,还需要通过POC来进一步验证它的技术可行性和可靠性。


(二)技术验证流程


1. 业务流程原子化拆分及原子能力函数化


基于业务专家对业务流程的理解,我们将“开通xx固移融合业务”的RPA流程分割为原子流程,并进一步抽象成颗粒度更细的原子能力。然后,对这些原子能力进行基础画像,包括功能描述、上下文约束、前后逻辑关系等多个维度。最后,将这些拆分好的原子能力,以函数序列的方式进行存储。


下面是办理该业务中一些基础的原子能力及函数列表:


表1:基于 RPA 开通“xx固移融合业务”的原子能力函数序列表


2. 大模型训练语料生成


通过大模型生成技术,我们生成了融合业务、移网、固网共100条开户语料,作为训练和验证语料,用来分别验证不同任务分解模式生成函数序列的准确性。


3. 通过 LLM 将任务分解成函数序列


利用大语言模型(LLM),对开通“xx固移融合业务”进行流程任务分解,并将分解出的原子任务以函数序列方式存储。

本次POC过程采用了4种模式进行函数序列的生成:


(1)coder 模型 + 规则约束生成 python 代码

(2)通用模型 + 规则约束生成 python 代码

(3)通用模型 + 规则约束生成函数序列

(4)通用大模型生成函数序列


针对相同的数据,这4种模式分别进行了任务分解成函数序列的POC测试。


图3:任务分解成函数序列 POC 测试


4. 任务分解准确性验证


通过与业务专家拆解出来的函数序列进行比对,我们验证了上述4种模式分解出来的函数序列的准确性。


图4:通过语料验证生成任务规划准确性


(三)POC 环境准备


本次POC的环境配置如下:


  • CPU:40核
  • 内存:64G
  • GPU:2 张 Nvidia RTX2080Ti 卡 40G 显存
  • 硬盘:500G 存储
  • 数据:大模型生成测试语料
  • 推理框架:Ollama
  • 模型:Qwen2.5-coder,Qwen2.5:14B


(四)POC 技术结论


1. POC 技术结果


使用 qwen2.5 大模型,采用 ProgPrompt 和规则限定进行智能流程规划与生成验证,经过严格的POC测试,结果如下表所示:


表2:POC 测试技术结果表



结合表2的结果进一步分析,可以得出以下结论:


(1)采用编码大模型生成python代码的方式,在推理方面有一定优势。但这次的测试受限于模型参数量较小,语义理解能力相对较差,导致正确率偏低。


(2)采用通用模型生成python代码,在推理调用函数过多时,容易导致程序出错,正确率会下降;而在调用少量函数时,正确率则相对较高。


(3)采用通用模型生成序列,通过语义理解进行生成,展现出了较好的正确率和稳定性。


(4)在没有规则限定的情况下,通用模型由于缺乏业务知识,几乎无法正确拆解和规划任务。


2. POC 技术结论


通过使用ProgPrompt+规则限定的方式,让大模型进行智能流程规划并生成RPA流程,可以有效地辅助业务流程开发,满足业务需求。


四、结语:ProgPrompt 结合 LLM 在 RPA 产品中的进一步应用思考


基于上述POC验证,ProgPrompt结合LLM技术可以有效协助RPA产品实现任务规划的高效生成。在未来的产品开发过程中,可以逐步将这项技术应用于RPA AI Native的开发实践。通过对话式RPA流程拼装,并进行动态执行,从而满足个性化、自动化的需求,并有效降低RPA业务场景的实施成本。

来源:https://www.53ai.com/news/RAG/2025032580623.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。