PaddleRS:使用超分模块提高真实的低分辨率无人机影像的分割精度
本项目利用PaddleRS超分模块处理低分辨率无人机影像,再结合PaddleSeg训练的Segformer模型提升分割效果。先通过DRN模型超分重建低质影像,再与直接用低分辨率影像的分割结果对比。虽无标注数据计算指标,但人眼判别显示,超分后预测结果更优,尤其在细节呈现上更接近人工标注真值。

PaddleRS:使用超分模块提高真实的低分辨率无人机影像的分割精度
一、项目背景
前段时间写了个项目:PaddleSeg:使用Transfomer模型对航空遥感图像分割,项目利用PaddleSeg模块训练Transfomer类的语义分割模型,在UDD6数据集中mIOU达到74.50% ,原论文使用DeepLabV3+的mIOU为73.18%, 高1.32%,训练效果图如下,其中:车辆:红色;道路:浅蓝色;植被:深蓝色;建筑立面:亮绿色;建筑屋顶:紫色;其他:焦绿色In [10]%cd /home/aistudio/import matplotlib.pyplot as pltfrom PIL import Imageoutput = Image.open(r"work/example/Seg/UDD6_result/added_prediction/000161.JPG")plt.figure(figsize=(18,12))#设置窗口大小plt.imshow(output), plt.axis('off')登录后复制 /home/aistudio登录后复制登录后复制
(登录后复制, (-0.5, 4095.5, 2159.5, -0.5))
登录后复制 训练的结果很不错,所使用的UDD6数据是从北京、葫芦岛、沧州、郑州四个城市,使用大疆精灵四无人机在60m-100m高度之间采集。但是,在实际的生产过程中,城市、飞行的高度、图像的质量会发生变化采集飞行高度升高可以在相同时间内获取更大面积的数据,但分辨率会降低,对低质量的数据,直接使用先前训练的数据预测效果不理想,再标注数据、训练模型将是一个不小的工作量,解决的方法除了提升模型的泛化能力,也可以考虑使用图像超分对低质量的无人机图像重建,然后再进行预测本项目使用PaddleRS提供的无人机遥感图像超分模块,对真实的低质量无人机影像数据进行超分,然后再使用前段时间用UDD6训练的Segformer模型预测,与直接使用低分辨率模型对比。由于没有对低质量数据进行标注无法计算指标。但人眼判别,超分之后的预测结果更好,左边是人工标注的label,中间是低分辨率的预测结果,右边是超分辨率重建后的结果In [12]
img = Image.open(r"work/example/Seg/gt_result/data_05_2_14.webp")lq = Image.open(r"work/example/Seg/lq_result/added_prediction/data_05_2_14.webp")sr = Image.open(r"work/example/Seg/sr_result/added_prediction/data_05_2_14.webp")plt.figure(figsize=(18, 12))plt.subplot(1,3,1), plt.title('GT')plt.imshow(img), plt.axis('off')plt.subplot(1,3,2), plt.title('predict_LR')plt.imshow(lq), plt.axis('off')plt.subplot(1,3,3), plt.title('predict_SR')plt.imshow(sr), plt.axis('off')plt.show()登录后复制 登录后复制登录后复制
二、数据介绍与展示
使用的数据是使用大疆精灵四无人机在上海,飞行高度为300m采集的,采集的时候天气也一般,可以看后续的示例发现质量不高。由于只是展示超分重建后进行预测的效果,所以只是简单标注了其中5张照片,毕竟标注数据真的是一件很费力的事! 要是能用公开数据集训练的模型来预测自己的数据,这多是一件美事!部分标注数据展示如下In [15]add_lb = Image.open(r"work/example/Seg/gt_result/data_05_2_19.webp")lb = Image.open(r"work/example/Seg/gt_label/data_05_2_19.webp")img = Image.open(r"work/ValData/DJI300/data_05_2_19.webp")plt.figure(figsize=(18, 12))plt.subplot(1,3,1), plt.title('image')plt.imshow(img), plt.axis('off')plt.subplot(1,3,2), plt.title('label')plt.imshow(lb), plt.axis('off')plt.subplot(1,3,3), plt.title('add_label')plt.imshow(add_lb), plt.axis('off')plt.show()登录后复制 登录后复制登录后复制
三、无人机遥感图像超分
因为PaddleRS提供了预训练的超分模型,所以这步主要分为以下两个步骤:准备PaddleRS并设置好环境调用PaddleRS中的超分预测接口,对低分辨率无人机影像进行超分重建In [3]# 从github上克隆仓库!git clone https://github.com/PaddleCV-SIG/PaddleRS.git登录后复制
正克隆到 'PaddleRS'...remote: Enumerating objects: 2325, done.remote: Counting objects: 100% (2325/2325), done.remote: Compressing objects: 100% (1086/1086), done.remote: Total 2325 (delta 1233), reused 2245 (delta 1182), pack-reused 0接收对象中: 100% (2325/2325), 3.22 MiB | 2.49 MiB/s, 完成.处理 delta 中: 100% (1233/1233), 完成.检查连接... 完成。登录后复制 In [ ]
# 安装依赖,大概一分多钟%cd PaddleRS/!pip install -r requirements.txt登录后复制 In [ ]
# 进行图像超分处理,使用的模型为DRNimport osimport paddleimport numpy as npfrom PIL import Imagefrom paddlers.models.ppgan.apps.drn_predictor import DRNPredictor# 输出预测结果的文件夹output = r'../work/example' # 待输入的低分辨率影像位置input_dir = r"../work/ValData/DJI300" paddle.device.set_device("gpu:0") # 若是cpu环境,则替换为 paddle.device.set_device("cpu")predictor = DRNPredictor(output) # 实例化filenames = [f for f in os.listdir(input_dir) if f.endswith('.webp')]for filename in filenames: imgPath = os.path.join(input_dir, filename) predictor.run(imgPath) # 预测登录后复制 超分重建结果前后对比展示In [6] # 可视化import osimport matplotlib.pyplot as plt%matplotlib inlinelq_dir = r"../work/ValData/DJI300" #低分辨率影像文件夹sr_dir = r"../work/example/DRN" #超分辨率影像所在文件夹img_list = [f for f in os.listdir(lq_dir) if f.endswith('.webp')]show_num = 3 # 展示多少对影像for i in range(show_num): lq_box = (100, 100, 175, 175) sr_box = (400, 400, 700, 700) filename = img_list[i] image = Image.open(os.path.join(lq_dir, filename)).crop(lq_box) # 读取低分辨率影像 sr_img = Image.open(os.path.join(sr_dir, filename)).crop(sr_box) # 读取超分辨率影像 plt.figure(figsize=(12, 8)) plt.subplot(1,2,1), plt.title('Input') plt.imshow(image), plt.axis('off') plt.subplot(1,2,2), plt.title('Output') plt.imshow(sr_img), plt.axis('off') plt.show()登录后复制 登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制
四、超分前后图像分割效果对比
使用的模型为Segformer_b3,用UDD6数据集训练了40000次已经将性能最好的模型以及.yml文件放在work文件夹下运行以下命令可对指定的文件夹下的图像进行预测首先用该模型对低质量的无人机数据进行预测,然后再使用超分重建后的图像预测,最后对比一下预测的效果In [18]%cd ..# clone PaddleSeg的项目!git clone https://gitee.com/paddlepaddle/PaddleSeg登录后复制
/home/aistudio正克隆到 'PaddleSeg'...remote: Enumerating objects: 16439, done.remote: Counting objects: 100% (1402/1402), done.remote: Compressing objects: 100% (811/811), done.remote: Total 16439 (delta 710), reused 1165 (delta 573), pack-reused 15037接收对象中: 100% (16439/16439), 341.09 MiB | 10.14 MiB/s, 完成.处理 delta 中: 100% (10574/10574), 完成.检查连接... 完成。登录后复制 In [ ]
# 安装依赖%cd /home/aistudio/PaddleSeg!pip install -r requirements.txt登录后复制 In [ ]
# 对低分辨率的无人机影像进行预测!python predict.py \ --config ../work/segformer_b3_UDD.yml \ --model_path ../work/best_model/model.pdparams \ --image_path ../work/ValData/DJI300 \ --save_dir ../work/example/Seg/lq_result登录后复制 In [ ]
# 对使用DRN超分重建后的影像进行预测!python predict.py \ --config ../work/segformer_b3_UDD.yml \ --model_path ../work/best_model/model.pdparams \ --image_path ../work/example/DRN \ --save_dir ../work/example/Seg/sr_result登录后复制
展示预测结果
其中,颜色如下:由于只标注了五张图片,所以只展示五张图片的结果,剩下的预测结果均在 work/example/Seg/文件夹下,其中左边是真值,中间是低分辨率影像预测结果,右边是超分重建后预测结果In [17]# 展示部分预测的结果%cd /home/aistudio/import matplotlib.pyplot as pltfrom PIL import Imageimport osimg_dir = r"work/example/Seg/gt_result" #低分辨率影像文件夹lq_dir = r"work/example/Seg/lq_result/added_prediction"sr_dir = r"work/example/Seg/sr_result/added_prediction" # 超分辨率预测的结果影像所在文件夹img_list = [f for f in os.listdir(img_dir) if f.endswith('.webp') ]for filename in img_list: img = Image.open(os.path.join(img_dir, filename)) lq_pred = Image.open(os.path.join(lq_dir, filename)) sr_pred = Image.open(os.path.join(sr_dir, filename)) plt.figure(figsize=(12, 8)) plt.subplot(1,3,1), plt.title('GT') plt.imshow(img), plt.axis('off') plt.subplot(1,3,2), plt.title('LR_pred') plt.imshow(lq_pred), plt.axis('off') plt.subplot(1,3,3), plt.title('SR_pred') plt.imshow(sr_pred), plt.axis('off') plt.show()登录后复制 /home/aistudio登录后复制登录后复制
登录后复制登录后复制登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制登录后复制登录后复制
登录后复制登录后复制登录后复制登录后复制登录后复制
相关攻略
Trae在Python数据分析与机器学习项目中主要通过四种方式提供支持:利用Auto模式自动生成并执行端到端分析脚本;通过AgentCLI命令行自动化机器学习建模流程;对现有代码进行智能调试与优化;借助语音交互快速构建数据处理函数。这些功能覆盖了从需求描述到代码生成、模型构建及代码优化的全流程。
在Python编程中,你是否也曾编写过类似的统计代码? 统计词频 count = {} for word in words: if word in count: count[word] += 1 else: count[word] = 1 实际上,这种高频的计数需求,完全可以通过Python内置
Trae稳定支持Python3 10至3 13版本,3 9及以下版本无法运行。Python3 14处于实验性支持阶段,核心功能可能受限。当存在多个3 10以上版本时,Trae优先选择虚拟环境中的解释器,其次为最高系统版本。此外,Trae仅兼容64位Python解释器,不支持32位架构。
在企业级数据采集与自动化运维实践中,IT团队普遍面临一个核心挑战:Python爬虫为何频繁报错,修补维护何时才能终结?随着前端技术演进与动态反爬机制的日益复杂,依赖DOM解析的传统爬虫脚本往往陷入“部署即过时,运行即异常”的困境。本文将深入解析传统爬虫代码脆弱性的根本原因,并系统介绍一种能够重塑数据
很多刚接触Docker的开发者常有一个误解:制作镜像不就是把源代码打包进去就行了吗?实际上,在企业级的标准化开发流程中,直接将源码打包进Docker镜像是非常不专业的做法。这会导致镜像体积臃肿、引入潜在安全风险,并且模糊了“构建环境”与“运行环境”的边界。本文将深入解析Java、Vue、Go、Pyt
热门专题
热门推荐
洞察市场先机:SOL合约持仓量深度解析与实战应用 在瞬息万变的加密货币衍生品市场,SOL合约持仓量如同一张实时绘制的“资金热力图”。它不仅揭示了多空双方投入的真实资本规模,更映射出市场情绪的微妙变化与潜在的趋势转折点。对于精明的交易者而言,掌握解读这张“地图”的能力,意味着能在市场博弈中抢占信息高地
《像素秘境·唤灵师》可通过九游APP或官网下载。在九游APP搜索游戏名即可预约并获取最新版,官网专区也提供高速与普通下载选项。两种方式均能便捷安装,专区还附有游戏攻略供参考。
车市价格战正处微妙临界点。二季度起,一股与以往降价潮不同的涨价暗流开始酝酿。截至五月中旬,至少15家主流新能源品牌已释放调价信号,或直接涨价,或收紧优惠,涉及比亚迪、特斯拉、蔚来等传统及新势力车企。
说起《上古卷轴5:重制版》的主线旅程,奥杜因克星任务绝对是一座绕不开的高峰。它不仅是叙事的关键转折点,更是一场对玩家策略、操作与耐心的综合试炼。想要征服这条恶龙,光有勇气可不够,一份清晰的行动路线图至关重要。接下来,我们就一起梳理一下这场终极对决的核心脉络与实用技巧。 一、剑指目标:前往奥杜因克星的
SOL合约限价单的最小价格单位是0 001美元。该单位是交易时报价的最小变动值,直接影响订单的精确性与灵活性。了解此规则对合约交易者有效设置订单和管理策略至关重要。





