使用PaddleDetection2.0自定义数据集实现火焰识别预测
该项目利用PaddleDetection2.0中的YOLOv3(主干为mobilenetv3轻量化模型)实现火焰识别目标检测,mAP达81.94%,可部署于森林防火监控。流程包括自定义数据集解压、环境准备、按9:1划分数据集,基于特定配置文件训练,还进行了模型评估、预测及效果可视化。

摘要
本项目旨在使用PaddleDetection2.0中的YOLOv3(主干网络为mobilenetv3的轻量化模型),通过少量代码实现火焰识别的目标检测,后期可部署用于监控森林防火等,mAP值达到81.94%
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

按以下几个步骤来介绍项目实现流程。
自定义数据集解压;准备环境;自定义数据集划分;模型训练:训练的配置文件说明;5.1 模型评估和预测:评估模型效果;
5.2 效果可视化:使用训练好的模型进行预测,同时对结果进行可视化。
1数据解压
将完成标注的火焰图片(VOC数据集)进行解压。
In [2]!unzip -oq /home/aistudio/huo.zip -d work/登录后复制
2准备环境
目前代码的版本是release/2.0,需要使用PaddlePaddle2.0.2版本。
In [3]! git clone https://gitee.com/paddlepaddle/PaddleDetection.git登录后复制
3自定义数据集的划分
将数据集按照9:1的比例进行划分,并生成train.txt和val.txt进行训练
In [4]import randomimport os#生成train.txt和val.txtrandom.seed(2020)xml_dir = '/home/aistudio/work/Annotations'img_dir = '/home/aistudio/work/JPEGImages'path_list = list()for img in os.listdir(img_dir): img_path = os.path.join(img_dir,img) xml_path = os.path.join(xml_dir,img.replace('jpg', 'xml')) path_list.append((img_path, xml_path))random.shuffle(path_list)ratio = 0.9train_f = open('/home/aistudio/work/train.txt','w') val_f = open('/home/aistudio/work/val.txt' ,'w')for i ,content in enumerate(path_list): img, xml = content text = img + ' ' + xml + '\n' if i < len(path_list) * ratio: train_f.write(text) else: val_f.write(text)train_f.close()val_f.close()#生成标签文档label = ['fire']with open('/home/aistudio/work/label_list.txt', 'w') as f: for text in label: f.write(text+'\n')登录后复制In [5]%cd PaddleDetection登录后复制
4 模型训练
新版本的PaddleDetection中训练方式依旧延续了之前的形式,用户在选择好模型后,只需要改动对应的配置文件后,只需要运行train.py文件,即可实现训练,但是在新的版本中,配置文件采用了更加耦合的设计
本项目中,使用YOLOv3模型里的yolov3_mobilenet_v3_large_ssld_270e_voc.yml进行训练
4.1配置文件示例
我们使用configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml配置进行训练。 在PaddleDetection2.0中,采用了模块解耦设计,用户可以组合配置模块实现检测器,并可自由修改覆盖各模块配置

4.2配置文件详细说明
从上图看到yolov3_mobilenet_v3_large_ssld_270e_voc.yml配置需要依赖其他的配置文件。在该例子中需要依赖:
'../datasets/voc.yml', '../runtime.yml', '_base_/optimizer_270e.yml', '_base_/yolov3_mobilenet_v3_large.yml', '_base_/yolov3_reader.yml',登录后复制
'_base_/optimizer_270e.yml',主要说明了学习率和优化器的配置。在其他的训练的配置中,学习率和优化器是放在了一个新的配置文件中。 '../datasets/voc.yml'主要说明了训练数据和验证数据的路径,包括数据格式(coco、voc等) '_base_/yolov3_reader.yml', 主要说明了读取后的预处理操作,比如resize、数据增强等等 '_base_/yolov3_mobilenet_v3_large.yml',主要说明模型、和主干网络的情况说明。 '../runtime.yml',主要说明了公共的运行状态,比如说是否使用GPU、迭代轮数等等登录后复制

4.3执行训练
执行下面命令开始进行训练
In [6]!python tools/train.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml --eval --use_vdl=True --vdl_log_dir="./output"登录后复制
4.4效果可视化
当打开use_vdl开关后,PaddleDetection会将训练过程中的数据写入VisualDL文件,可实时查看训练过程中的日志。记录的数据包括:
loss变化趋势mAP变化趋势使用如下命令启动VisualDL查看日志
# 下述命令会在127.0.0.1上启动一个服务,支持通过前端web页面查看,可以通过--host这个参数指定实际ip地址visualdl --logdir output/登录后复制
在浏览器输入提示的网址,效果如下:


5 模型评估和预测
5.1 模型评估
python -u tools/eval.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml \-o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams登录后复制In [7]
!python -u tools/eval.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml -o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams登录后复制
5.2 模型预测
在执行tools/infer.py后,在output文件夹下会生成对应的预测结果
python tools/infer.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml \ -o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams \--infer_img=dataset/113.webp登录后复制In [8]
!python tools/infer.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml -o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams --infer_img=dataset/113.webp登录后复制结果展示

原图

预测图
相关攻略
Pywinrm 通过Windows远程管理(WinRM)协议,让Python能够像操作本地一样执行远程Windows命令,真正打通了跨平台管理的最后一公里。 在混合IT环境中,Linux机器管理Wi
早些时候,聊过 Python 领域那场惊心动魄的供应链攻击。当时我就感叹,虽然我们 JavaScript 开发者对这类套路烂熟于心,但亲眼目睹这种规模的“投毒”还是头一次。 早些时候,聊过 Pyth
Toga 是 BeeWare 家族的核心成员,号称“写一次,跑遍所有平台”,而且用的是系统原生控件,不是那种一看就是网页套壳的界面 。 写了这么多年 Python,你是不是也想过:要是能一套代码跑
异常处理的核心:让错误在正确的地方被有效处理。正确的地方,就是别在底层就把异常吞了,也别在顶层还抛裸奔的 Exception。 异常处理写得好,半夜不用起来改 bug。1 你是不是也这么干过?tr
1 Skills机制概述 提起OpenClaw的Skills机制,不少人可能会把它想象成传统意义上的可执行插件。其实,它的内涵要更精妙一些。 简单说,Skills本质上是一套基于提示驱动的能力扩展机制。它并不是一个可以独立“跑”起来的程序模块,而是通过一份结构化描述文件(核心就是那个SKILL m
热门专题
热门推荐
4月3日消息,今日,OPPO官微宣布,OPPO Find X9s Pro将首发新一代1nit明眸护眼屏,宣称全场景都护眼。据悉,这块屏幕来自新一代天马天工屏,搭载全新U9 Pro发光基材,从材料、器
Word行距异常增大可按五步解决:一、重置段前段后间距为0并设单倍行距;二、改用固定值行距(如小四号设18磅);三、清除样式继承并修复Normal模板;四、禁用自动格式更正干扰项;
汽车4月3日消息,4月3日,“年轻人第一台GT”比亚迪2026款海豹06GT新车交付仪式在深圳举行,作为海洋网又一搭载第二代刀片电池和最新闪充技术的重磅车型,上市售价12 89万元-16 99万元,
汽车4月3日消息,广汽埃安宣布将于 4 月 16 日举办品牌焕新发布会,埃安 N60 汽车将同步开启预售。目前新车已开启盲订,支付 99 元定金可享价值 5088 元礼遇。该车由曾任职于宝马等品牌的
4月5日消息,一起教育科技(NASDAQ: YQ)日前发布截至2025年12月31日的财报。财报显示,一起教育科技2025年营收为1 06亿(约1520万美元),较上年同期的1 89亿元下降44%。





