【PaddleDetection2.0专项】快速实现行人检测
本文介绍如何用PaddleDetection2.0快速实现行人检测。先说明其提供多种检测模型,行人检测可用YOLOv3,精度51.8,适用于智能监控。接着讲操作步骤,包括克隆仓库、安装依赖,还介绍了模型结构、训练参数配置(改类别数和数据集路径)、精度指标及预测方法与示例。

【PaddleDetection2.0专项】快速实现行人检测
PaddleDetection2.0提供了针对不同场景的基于PaddlePaddle的检测模型,用户可以下载模型进行使用。
行人检测(Pedestrian Detection)
行人检测的主要应用有智能监控。在监控场景中,大多是从公共区域的监控摄像头视角拍摄行人,获取图像后再进行行人检测。
克隆PaddleDetection仓库
In [1]# gitee 国内下载比较快!git clone https://gitee.com/paddlepaddle/PaddleDetection.git -b release/2.0 # github# !git clone https://github.com/PaddlePaddle/PaddleDetection.git -b release/2.0登录后复制 In [2]
%cd ~/PaddleDetection!pip install -r requirements.txt登录后复制
1. 模型结构
Backbone为Dacknet53的YOLOv3。
2. 训练参数配置
PaddleDetection提供了使用COCO数据集对YOLOv3进行训练的参数配置文件yolov3_darknet53_270e_coco.yml,与之相比,在进行行人检测的模型训练时,我们对以下参数进行了修改:
num_classes: 1dataset_dir: dataset/pedestrian具体如下所示:
num_classes: 1TrainDataset: !COCODataSet dataset_dir: dataset/pedestrian anno_path: annotations/instances_train2017.json image_dir: train2017 data_fields: ['image', 'gt_bbox', 'gt_class', 'is_crowd']EvalDataset: !COCODataSet dataset_dir: dataset/pedestrian anno_path: annotations/instances_val2017.json image_dir: val2017TestDataset: !ImageFolder anno_path: configs/pedestrian/pedestrian.json登录后复制
2. 精度指标
模型在我们针对监控场景的内部数据上精度指标为:
IOU=.5时的AP为 0.792。
IOU=.5-.95时的AP为 0.518。
3. 预测
用户可以使用我们训练好的模型进行行人检测:
export CUDA_VISIBLE_DEVICES=0python -u tools/infer.py -c configs/pedestrian/pedestrian_yolov3_darknet.yml \ -o weights=https://paddledet.bj.bcebos.com/models/pedestrian_yolov3_darknet.pdparams \ --infer_dir configs/pedestrian/demo \ --draw_threshold 0.3 \ --output_dir configs/pedestrian/demo/output登录后复制 In [5]
%cd ~/PaddleDetection/!export CUDA_VISIBLE_DEVICES=0!python -u tools/infer.py -c configs/pedestrian/pedestrian_yolov3_darknet.yml \ -o weights=https://paddledet.bj.bcebos.com/models/pedestrian_yolov3_darknet.pdparams \ --infer_dir configs/pedestrian/demo \ --draw_threshold 0.3 \ --output_dir configs/pedestrian/demo/output登录后复制
预测结果示例:
In [16]import matplotlib.image as mpimgimport matplotlib.pyplot as pltimport ospath = '/home/aistudio/PaddleDetection/configs/pedestrian/demo/output'imgs = os.listdir(path)plt.figure(figsize=(160, 40))for i in range(len(imgs)): img_path = os.path.join(path, imgs[i]) img = mpimg.imread(img_path) plt.subplot(4, 1, i+1) plt.imshow(img)plt.show()登录后复制
登录后复制
相关攻略
Trae在Python数据分析与机器学习项目中主要通过四种方式提供支持:利用Auto模式自动生成并执行端到端分析脚本;通过AgentCLI命令行自动化机器学习建模流程;对现有代码进行智能调试与优化;借助语音交互快速构建数据处理函数。这些功能覆盖了从需求描述到代码生成、模型构建及代码优化的全流程。
在Python编程中,你是否也曾编写过类似的统计代码? 统计词频 count = {} for word in words: if word in count: count[word] += 1 else: count[word] = 1 实际上,这种高频的计数需求,完全可以通过Python内置
Trae稳定支持Python3 10至3 13版本,3 9及以下版本无法运行。Python3 14处于实验性支持阶段,核心功能可能受限。当存在多个3 10以上版本时,Trae优先选择虚拟环境中的解释器,其次为最高系统版本。此外,Trae仅兼容64位Python解释器,不支持32位架构。
在企业级数据采集与自动化运维实践中,IT团队普遍面临一个核心挑战:Python爬虫为何频繁报错,修补维护何时才能终结?随着前端技术演进与动态反爬机制的日益复杂,依赖DOM解析的传统爬虫脚本往往陷入“部署即过时,运行即异常”的困境。本文将深入解析传统爬虫代码脆弱性的根本原因,并系统介绍一种能够重塑数据
很多刚接触Docker的开发者常有一个误解:制作镜像不就是把源代码打包进去就行了吗?实际上,在企业级的标准化开发流程中,直接将源码打包进Docker镜像是非常不专业的做法。这会导致镜像体积臃肿、引入潜在安全风险,并且模糊了“构建环境”与“运行环境”的边界。本文将深入解析Java、Vue、Go、Pyt
热门专题
热门推荐
Binance币安 欧易OKX Huobi火币 访问币安(Binance)官网时,平台会根据用户所在地区进行智能跳转,这是为了满足不同区域的合规要求。目前,全球通用的主站官方域名是 binance com,记住这个地址,通常是最直接、最安全的访问起点。 如何正确访问币安官网 操作其实很简单:在浏览器
BNB突破1000美元:长期持有者为何坚定不离场? 当BNB价格成功站上1000美元大关,市场并未出现预期中的大规模获利了结潮。相反,众多长期持有者选择了继续坚守。这一现象背后,并非简单的市场情绪驱动,而是基于一套由代币经济模型、生态活力、传统资本流入及政策风险缓解共同构成的复合价值逻辑。本文将深度
标普500创新高,但以比特币计价却暴跌88%:重新审视资产估值坐标系 当市场为标普500指数屡创新高而欢呼时,一个颠覆性的视角正在引发深思。如果我们将计价单位从美元切换为比特币,这幅繁荣图景将彻底改写。数据显示,自2020年以来,标普500指数以美元计价上涨了106%,表现稳健;然而,若以比特币作为
交易的基石——两大内核分析流派 在探讨具体的买卖时机之前,有必要先理清驱动市场波动的两套底层逻辑:基本面分析与技术分析。这两者,好比是导航的地图和罗盘,各有侧重,却又相辅相成。 1 基本面分析:评估“真实价值” 这一流派的核心,是探究资产的内在价值。它关注三个层面: 项目质量: 这个项目究竟要解决
如何利用AI技术提升文档处理效率,快速生成专业报告和PPT 在内容爆炸的时代,文档处理的速度与质量,直接决定了商业决策和项目推进的效率。过去,一份专业报告或一份精心设计的PPT,背后往往意味着团队数日乃至数周的伏案工作。但如今,情况正在发生根本性的转变。行业观察显示,利用AI技术优化文档工作流,正从





