游乐游手机版
首页/AI教程/文章详情

火语言RPA提取网页相对路径href拼接完整URL的案例

时间:2026-06-09 15:40
使用火语言RPA提取网页中所有相对路径href,通过循环遍历并拼接根域名,生成完整的可访问URL,解决网页抓取时链接缺少域名导致无法直接使用的痛点,适用于批量访问详情页及数据采集场景。

一、案例说明

网页抓取时,多数网站返回的链接都是相对路径——光秃秃的,没有域名,直接拿着它去访问肯定报错。这个案例就是用火语言RPA,把页面里所有的相对链接一次性抓出来,再循环补上网站根域名,拼成标准的完整URL。说白了,就是解决“链接不能用”的痛点。适用于批量访问详情页、数据采集等场景。

二、案例逻辑

打开浏览器,进入目标公告页面(https://www.ccgp.gov.cn/cggg/zygg/ ),先把页面上所有链接的href相对路径批量提取出来。然后一条一条遍历这些短链接,拼接上根域名,生成可以直接点开的完整URL。逻辑清晰,没有弯弯绕。

三、操作细则

1、先建一个空列表,叫list1,用来存后面的完整链接。

image.png

2、打开浏览器,选一个你常用的浏览器类型(比如Chrome、Edge都行)。

image.png

3、在浏览器里输入目标网址:https://www.ccgp.gov.cn/cggg/zygg/ ,打开页面。

image.png

4、关键一步:抓取元素。用XPath定位到所有链接,获取它们的href属性值。可以看到,抓回来的都是相对路径(比如 ./fblbgg/……),没法直接用。这里要做的就是补全链接。

  • 目标元素://ul[@class="c_list_bid"]/li//a[@target="_blank"]
  • 返回结果:指定属性值
  • 属性名称:href

image.png

5、用一个 ForEach循环,逐条处理每一条短链接。这一步是整个流程的核心。

image.png

5.1 先打印日志,看看遍历出来的item是什么内容。打印结果:./fblbgg/202606/t20260605_26696649.htm。而完整URL应该是:https://www.ccgp.gov.cn/cggg/zygg/fblbgg/202606/t20260605_26696649.htm。对比一下,只需要把开头的 ./ 去掉,再拼上域名就可以了。

image.png

5.2 用 字符串替换 组件,把 item 里的 "./" 替换成空值,去掉这个恼人的前缀。

image.png

5.3 再打印日志确认:替换后的结果已经变成了 fblbgg/202606/t20260605_26696649.htm,干净多了。

image.png

5.4 接下来用 字符串连接 组件,把根域名拼到前面。注意域名要带路径:https://www.ccgp.gov.cn/cggg/zygg/,这样就得到了完整的可访问链接。

image.png

5.5 打印拼接后的结果,确认无误。

image.png
image.png

5.6 最后一步,用 列表添加一项,把拼好的完整链接存入全局列表 List1 中,方便后续使用。

image.png

6、全部处理完之后,别忘了关闭浏览器,释放资源。

image.png

四、划重点

网页抓取的 href 大多都是相对路径,不带域名,直接打开肯定报错。所以必须补上网站根域名。这里我们用了“字符串连接”组件来实现,当然你也可以直接使用“网址/图片地址获取”组件,效果一样。关键在于理解相对路径→绝对路径的转换逻辑,一通百通。

来源:https://developer.aliyun.com/article/1740095
上一篇办好比赛的关键方法与技巧 下一篇前端代码压缩对浏览器兼容性的影响分析
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
批处理BAT入门教程第一篇
AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。

从零开始批处理命令For循环详解与实战案例
AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。

批评你的人是你生命中的贵人
AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。

测试人员角色定位与职责详解
AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。

经营成功测试生涯的实用方法与策略
AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通