火语言RPA提取网页相对路径href拼接完整URL的案例

时间：2026-06-09 15:40

使用火语言RPA提取网页中所有相对路径href，通过循环遍历并拼接根域名，生成完整的可访问URL，解决网页抓取时链接缺少域名导致无法直接使用的痛点，适用于批量访问详情页及数据采集场景。

一、案例说明

网页抓取时，多数网站返回的链接都是相对路径——光秃秃的，没有域名，直接拿着它去访问肯定报错。这个案例就是用火语言RPA，把页面里所有的相对链接一次性抓出来，再循环补上网站根域名，拼成标准的完整URL。说白了，就是解决“链接不能用”的痛点。适用于批量访问详情页、数据采集等场景。

二、案例逻辑

打开浏览器，进入目标公告页面（https://www.ccgp.gov.cn/cggg/zygg/ ），先把页面上所有链接的href相对路径批量提取出来。然后一条一条遍历这些短链接，拼接上根域名，生成可以直接点开的完整URL。逻辑清晰，没有弯弯绕。

三、操作细则

1、先建一个空列表，叫list1，用来存后面的完整链接。

2、打开浏览器，选一个你常用的浏览器类型（比如Chrome、Edge都行）。

3、在浏览器里输入目标网址：https://www.ccgp.gov.cn/cggg/zygg/ ，打开页面。

4、关键一步：抓取元素。用XPath定位到所有链接，获取它们的href属性值。可以看到，抓回来的都是相对路径（比如 ./fblbgg/……），没法直接用。这里要做的就是补全链接。

目标元素：//ul[@class="c_list_bid"]/li//a[@target="_blank"]
返回结果：指定属性值
属性名称：href

5、用一个 ForEach循环，逐条处理每一条短链接。这一步是整个流程的核心。

5.1 先打印日志，看看遍历出来的item是什么内容。打印结果：./fblbgg/202606/t20260605_26696649.htm。而完整URL应该是：https://www.ccgp.gov.cn/cggg/zygg/fblbgg/202606/t20260605_26696649.htm。对比一下，只需要把开头的 ./ 去掉，再拼上域名就可以了。

5.2 用 字符串替换 组件，把 item 里的 "./" 替换成空值，去掉这个恼人的前缀。

5.3 再打印日志确认：替换后的结果已经变成了 fblbgg/202606/t20260605_26696649.htm，干净多了。

5.4 接下来用 字符串连接 组件，把根域名拼到前面。注意域名要带路径：https://www.ccgp.gov.cn/cggg/zygg/，这样就得到了完整的可访问链接。

5.5 打印拼接后的结果，确认无误。

5.6 最后一步，用 列表添加一项，把拼好的完整链接存入全局列表 List1 中，方便后续使用。

6、全部处理完之后，别忘了关闭浏览器，释放资源。

四、划重点

网页抓取的 href 大多都是相对路径，不带域名，直接打开肯定报错。所以必须补上网站根域名。这里我们用了“字符串连接”组件来实现，当然你也可以直接使用“网址/图片地址获取”组件，效果一样。关键在于理解相对路径→绝对路径的转换逻辑，一通百通。

来源：https://developer.aliyun.com/article/1740095

其他

上一篇办好比赛的关键方法与技巧 下一篇前端代码压缩对浏览器兼容性的影响分析

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧，覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景，可一键完成系统维护与文件管理工作，极大提升自动化操作效率和便捷性。

AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名； r递归搜索指定路径及其子目录中的文件； l生成数值序列； f可解析文件、字符串或命令输出，通过delims、tokens、skip、eol等选项灵活处理内容。

AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜，因为他们关注你、助你成长。面对批评应包容反思，用行动改进而非辩解。接受批评是自我完善的过程，能让人少走弯路，避免重复犯错。这样的人正是生命中的贵人，值得感恩与珍惜。

AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变，最终核心职责是提供关键信息，协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态，而非单纯把关或追求完美。

AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年，我在田纳西大学攻读研究生时，意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择，说起来还有些戏剧性——某个早晨，教授质问我为何缺席那么多开发会议，我解释说这些会议总是安排在周末早上，对我这个第一次离家、刚入学的学生来说实在不便。结果呢？等待我的不是解聘通