游乐游手机版
首页/AI热点日报/热点详情

RPA Agent进化一年后的迭代现状

类型:热点整理2026-06-03
智能体这个概念一火,大语言模型算是找到了真正落地的抓手。从最初的概念验证到现在,几乎每个月都能看到新的进展。尤其是在智能体工作流(Agentic Workflow)的加持下,这些数字助理不仅变得更聪明,也更皮实——能处理复杂任务,也能融入传统业务流程。 之前有观点提到过,广义上的Agentic Wo

智能体这个概念一火,大语言模型算是找到了真正落地的抓手。从最初的概念验证到现在,几乎每个月都能看到新的进展。尤其是在智能体工作流(Agentic Workflow)的加持下,这些数字助理不仅变得更聪明,也更皮实——能处理复杂任务,也能融入传统业务流程。

之前有观点提到过,广义上的Agentic Workflow其实是传统软件、大语言模型和AI Agent的新组合。其中,用RPA这类超自动化工具把轻量级LLM工作流和现有系统串联起来,正在成为企业级应用的关键路径。为什么?因为单纯的API智能体在碰到那些没有开放接口的“老家伙”系统时,往往束手无策。而RPA通过UI自动化,恰恰能补上这块短板。

正因如此,基于RPA构建的智能体(业内常称RPA Agent)越来越受重视。它采用“API+UI”双重自动化策略,既稳又灵,堪称智能体落地的“双保险”。从去年LLM爆发至今,RPA厂商们也没闲着,纷纷完成产品化升级。恰逢实在智能发布了实在Agent 7.0,我们就拿它当样本,看看国产RPA Agent到底进化到了什么程度。

先来看两个例子

在聊具体功能前,不如先看两个实际操作场景,直观感受下。

案例1:采集豆瓣新片排行榜,一键发给同事

假如你想给同事推荐最近十部好电影。过去你得打开豆瓣,一个个复制片名、评分,再转到微信或钉钉发过去。现在呢?打开实在Agent,输入一句“采集豆瓣电影片排行榜前十(电影名、评分)”,它就能自动分析需求,拆解步骤,然后点一下“执行”。几秒钟后,数据就已经填到了钉钉对话框里,直接发送。全程无需手动复制粘贴。

案例2:在腾讯文档制作年终汇报幻灯片

这又是一个典型的办公场景。正常流程:打开腾讯文档,搜索相关文档,手动制作PPT。而用实在Agent,只需告诉它“明天要去汇报,去腾讯文档里做一个叫年中汇报的幻灯片”,它就能分解任务,自动生成幻灯片。几分钟的活,现在一句话搞定。

除此之外,还有抓取百度贴吧热门贴、监控京东降价商品、自动结算购物车等等演示案例。实测中,包括12306查车次、给微信好友加标签并发送消息,都能顺利完成。目前实在Agent已经可以精确操作钉钉、微信、企业微信等办公软件,也能通过屏幕识别技术搞定淘宝、京东、携程、12306等网站。适配范围还在不断扩展。

实在Agent 7.0有什么特点?

从这两个案例就能看出,新版实在Agent 7.0有几个关键升级点:

  • 自然对话交互:真正的“All in One”式助理体验,不用学命令,说话就行。
  • 意图理解+流程规划:更强的语义理解能力,能把一句话拆解成可执行的步骤。
  • 多代产品能力集成:把一代RPA、二代IPA数字员工的元素拾取、组件编排等能力全部打包进来了。
  • 精准界面操作:基于多模态屏幕语义理解,扫描识别界面元素,操作更准。

底层TRAS大模型也再次迭代,参数量更大,既能闲聊科普,也能高效执行任务。在文档问答方面,基于内置的IDP文档系统,可以实现对文件内容的精确问答与处理。

此外,实在智能还在深入探索企业大模型、数字员工运营平台、RAG和Agentic Workflow等整合方案,并提出了“企业大脑”的构想。通过RAG技术,让Agent能回答企业内部特有的知识和流程问题,让老资产也能产出新价值。

这次版本大更新历时近一年,底层技术架构、功能组件都做了深度迭代。实在智能本身在RPA领域有6年积累,AI方面也有6年沉淀,这种双线积累让他们在LLM爆发后能快速扛起RPA Agent的大旗。作为国内首家发布明确AI Agent产品的公司,实在智能的产品不仅能服务B端企业级场景,也正在用标准化、易用化的方式触达C端个人用户。

与Coze等Agent平台有什么区别?

看上面两个案例,你是不是觉得操作特别简单?没错,实在Agent的使用流程就是三句话:“输入需求—点击执行—收到结果”。全程几乎不用用户操心,实现了“端到端”的软件使用体验。理论上,随着迭代,这种模式可以覆盖任何业务流程的自动化创建和执行。

现在大家更熟悉的智能体平台可能是Coze、Dify、GPTs。但实在Agent和它们有个本质区别:在其他平台上,你需要手动构建智能体(输入提示词、选插件、搭工作流),然后让智能体自动执行;而实在Agent的构建过程本身也是自动化的——用户只需提需求,系统自己完成智能体的创建并执行任务。这就实现了从“构建”到“执行”的全自动化。

换句话说,用户再也不用像在Coze上那样花时间设计工作流了,一句话就能得到可用的智能体。这极大降低了门槛,真正把“所想即所得”变成了现实。

另一个关键差异是:想在其他平台上构建能深度操作微信、钉钉的智能体,必须依赖API接口。而很多应用根本没有开放API,或者接口有限制、不安全。RPA通过模拟人类操作的方式,完全绕开了这些问题,而且更灵活。

“端到端”这个概念在B端谈得很多,强调的是技术方案的完整性。而实在智能的“端到端”有双重含义:一是从B端到C端,既服务企业级数字员工需求,也解决个人用户的长尾自动化需求——新版本确实做到了;二是在C端的技术实现上,把“端到端”的便捷性赋予了智能体的构建与应用,把“RPA人人可用”的愿景扩展为“Agent人人可用”。在LLM的助力下,这个愿景正在加速成为现实。

2023年8月,实在智能发布第一款AI Agent,成为国内首家。2024年8月,实在Agent 7.0问世,再次在RPA业界率先推出Agent产品形态。从概念到落地,仅仅用了1年。

来源:https://www.53ai.com/news/shuziyuangong/2024090678405.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。