大模型业务流程原子化编排在RPA中的应用_AI热点日报

大模型业务流程原子化编排在RPA中的应用

类型：热点整理2026-07-04

RPA的开发过程中，有个老问题始终绕不过去——大量重复的业务步骤需要反复编写。这不仅让实施成本居高不下，也拖慢了整体的开发节奏。随着大语言模型（LLM）技术的快速迭代，通过智能体来编排RPA原子业务流程，从而提升这些原子流程的复用度，已经从构想走向了可能。这篇文章将详细拆解RPA业务流程原子化的技术

RPA的开发过程中，有个老问题始终绕不过去——大量重复的业务步骤需要反复编写。这不仅让实施成本居高不下，也拖慢了整体的开发节奏。随着大语言模型（LLM）技术的快速迭代，通过智能体来编排RPA原子业务流程，从而提升这些原子流程的复用度，已经从构想走向了可能。这篇文章将详细拆解RPA业务流程原子化的技术趋势、背后的技术原理，并结合亚信科技AIRPA产品中的技术预研与POC测试，来验证这一技术落地的现实可行性。希望能给关注这一方向的研究者和从业者带来一些实质性的参考。

RPA 的业务编排模式，正在经历从手动编排向智能编排、从基于符号编程向基于LLM编程的转变。利用LLM，我们可以高效地将RPA业务流程拆解成一个个原子化的操作，这些基础操作被抽象出来并融入到提示词中，进而让LLM根据这些基础模块自动规划编排成完整的业务流程，最后通过动作的逻辑顺序来校验整个流程的正确性。

通过严格的技术预研和POC测试，我们发现，基于大模型的业务流程原子化编排技术，特别是采用ProgPrompt+规则限定的方式，让大模型进行智能流程规划并生成RPA流程，确实能够有效辅助业务开发，满足实际需求。

一、技术背景和驱动力

LLM技术的高速发展，使得用它来生成情境机器人的任务规划不再是天方夜谭。不过，在任务规划的过程中，需要为机器人定义并注入大量的领域知识。问题在于，当机器人面对不同的任务领域时，如何高效提供这些差异化的领域知识，就成了制约规划效率的核心瓶颈。

由南加州大学和英伟达联合开发的ProgPrompt方法，恰好提供了一种能够跨越不同情境环境、不同机器人能力和任务的生成提示结构。它的核心思想，是用程序化的提示结构来引导语言模型，让其生成适用于特定情境的机器人任务规划。具体操作是定义一个结构化的提示，里面包含环境中可用的动作、目标以及示例程序。这样一来，语言模型即使没有额外的领域信息，也能根据自然语言指令，生成出一套行动序列。打个比方，ProgPrompt将机器人规划表示成了Python程序，让LLM通过“完成代码”的方式来生成具体的任务规划。

当然，在实际应用中，通过ProgPrompt算法生成的规划，还需要进一步验证其生成的正确性和稳定性——毕竟，靠谱才是硬道理。

二、ProgPrompt 结合 LLM 生成任务规划的技术原理

基于ProgPrompt算法结合LLM来生成任务规划，是整个流程的核心技术环节。其技术原理如下图所示。

图1：基于 ProgPrompt 算法结合 LLM 技术生成任务规划的技术原理

（一）结构化代码创建

首先，按照LLM提示的范例，创建一个结构化的Python代码提示。在这个过程中，ProgPrompt方法会提供包括import语句、目标列表和示例任务在内的内容（在图上标注为PROMPT for planning）。它的巧妙之处在于，用Python中可用的功能来构建提示，以自然语言指令为条件，引导LLM完成代码的生成，进而输出情境机器人的任务规划。

（二）基于 ProgPrompt 的具体目标任务规划

参考代码结构和示例任务后，结合具体的业务场景，就能调整并完成一个针对特定任务目标的规划。在这个环节里，有几个元素会特别突出：提示注释、以目标为参数的导入函数调用操作，以及带有恢复步骤的assertions。其中，代码注释的作用不容小觑——它有助于将高级任务分解成逻辑子任务。这种划分能让LLM用更自然语言的方式表达出自己关于任务和子任务的理解，从而辅助规划。同时，注释还能告知LLM当前目标，有效减少输出结果不连贯、发散或重复的可能性。已有研究表明，类似的中间摘要对于提升LLM在一系列推理任务上的表现非常有效。

（三）执行过程检查

图中标注的PROMPT for state feedback，代表的是示例检查。它主要用于展示程序的执行情况：一个程序语句是成功还是失败，以及生成的规划如何在执行下一步之前纠正错误。右下角则完整展示了整个程序的执行过程，一目了然。

三、生成任务规划技术在 RPA 产品中的应用分析

为了评估并切实推动ProgPrompt算法在亚信科技RPA产品中的应用，RPA产品团队专门组织了一次技术预研，核心目标是支撑RPA任务规划的智能化。我们选择了一个典型的RPA场景，建立了一套完整的技术评估流程，最后通过POC方式筛选出了目前效果最佳的技术路线。

（一）场景选择

这次技术预研的核心，是用ProgPrompt+LLM生成任务规划的技术，来部分替代现有的RPA开发模式，提升开发效率，同时增强RPA原子业务能力的复用性。于是，我们选择了一个非常典型的RPA业务流程——运营商为客户开通“xx固移融合业务”。

该业务的具体流程，如下图2所示。

图2：xx固移融合业务 RPA 开通流程图

进一步梳理这个流程，可以将其拆解为若干个原子能力：

能力1：CBSS 首页通用认证能力

能力2：固网开户套餐选择

能力3：xx固移融合业务套餐开户

能力n：……

这些原子能力能否被高效、准确地生成，并且在后续开发中保持高复用性，直接决定了RPA的开发效率。而基于ProgPrompt的任务规划生成技术，为我们提供了实现这一目标的可能性。当然，还需要通过POC来进一步验证它的技术可行性和可靠性。

（二）技术验证流程

1. 业务流程原子化拆分及原子能力函数化

基于业务专家对业务流程的理解，我们将“开通xx固移融合业务”的RPA流程分割为原子流程，并进一步抽象成颗粒度更细的原子能力。然后，对这些原子能力进行基础画像，包括功能描述、上下文约束、前后逻辑关系等多个维度。最后，将这些拆分好的原子能力，以函数序列的方式进行存储。

下面是办理该业务中一些基础的原子能力及函数列表：

表1：基于 RPA 开通“xx固移融合业务”的原子能力函数序列表

2. 大模型训练语料生成

通过大模型生成技术，我们生成了融合业务、移网、固网共100条开户语料，作为训练和验证语料，用来分别验证不同任务分解模式生成函数序列的准确性。

3. 通过 LLM 将任务分解成函数序列

利用大语言模型（LLM），对开通“xx固移融合业务”进行流程任务分解，并将分解出的原子任务以函数序列方式存储。

本次POC过程采用了4种模式进行函数序列的生成：

（1）coder 模型 + 规则约束生成 python 代码

（2）通用模型 + 规则约束生成 python 代码

（3）通用模型 + 规则约束生成函数序列

（4）通用大模型生成函数序列

针对相同的数据，这4种模式分别进行了任务分解成函数序列的POC测试。

图3：任务分解成函数序列 POC 测试

4. 任务分解准确性验证

通过与业务专家拆解出来的函数序列进行比对，我们验证了上述4种模式分解出来的函数序列的准确性。

图4：通过语料验证生成任务规划准确性

（三）POC 环境准备

本次POC的环境配置如下：

CPU：40核
内存：64G
GPU：2 张 Nvidia RTX2080Ti 卡 40G 显存
硬盘：500G 存储
数据：大模型生成测试语料
推理框架：Ollama
模型：Qwen2.5-coder，Qwen2.5:14B

（四）POC 技术结论

1. POC 技术结果

使用 qwen2.5 大模型，采用 ProgPrompt 和规则限定进行智能流程规划与生成验证，经过严格的POC测试，结果如下表所示：

表2：POC 测试技术结果表

结合表2的结果进一步分析，可以得出以下结论：

（1）采用编码大模型生成python代码的方式，在推理方面有一定优势。但这次的测试受限于模型参数量较小，语义理解能力相对较差，导致正确率偏低。

（2）采用通用模型生成python代码，在推理调用函数过多时，容易导致程序出错，正确率会下降；而在调用少量函数时，正确率则相对较高。

（3）采用通用模型生成序列，通过语义理解进行生成，展现出了较好的正确率和稳定性。

（4）在没有规则限定的情况下，通用模型由于缺乏业务知识，几乎无法正确拆解和规划任务。

2. POC 技术结论

通过使用ProgPrompt+规则限定的方式，让大模型进行智能流程规划并生成RPA流程，可以有效地辅助业务流程开发，满足业务需求。

四、结语：ProgPrompt 结合 LLM 在 RPA 产品中的进一步应用思考

基于上述POC验证，ProgPrompt结合LLM技术可以有效协助RPA产品实现任务规划的高效生成。在未来的产品开发过程中，可以逐步将这项技术应用于RPA AI Native的开发实践。通过对话式RPA流程拼装，并进行动态执行，从而满足个性化、自动化的需求，并有效降低RPA业务场景的实施成本。

来源：https://www.53ai.com/news/RAG/2025032580623.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。