【第五期论文复现赛-语义分割】DMNet
第五期论文复现赛DMNet,DMNet适用于语义分割任务,本次复现的目标是Cityscapes 验证集miou 79.64%,复现的miou79.76%,该算法已被PaddleSeg合入。

【论文复现赛】DMNet:Dynamic Multi-scale Filters for Semantic Segmentation
本文提出了动态卷积模块(Dynamic Convolutional Modules),该模块可以利用上下文信息生成不同大小的卷积核,自适应地学习图片的语义信息。该模型在Cityscapes验证集上mIOU为79.64%,本次复现的mIOU为79.76%,该算法已被PaddleSeg收录。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
代码参考:https://github.com/open-mmlab/mmsegmentation/tree/master/configs/dmnet
本项目地址:https://github.com/justld/DMNet_paddle
一、模型结构

如上图所示,输入图片经过CNN(backbone网络)后,得到Feature Map,接着将Feature Map送入DCM模块,不同的DCM模块有着不同大小的卷积核,对应的感受野也不同,将特征图concat后送入语义分割head进行像素级分割。
二、DCM(Dynamic Convolutional Modules)

上图为DCM模块,该模块有2个分支:
分支一:使用1x1的卷积核压缩特征图的通道,得到fk(x);
分支二(Context-aware filters):对特征图进行平均池化,得到不同大小的特征图;
得到2个分支的特征图后,把分支二的特征图作为卷积核,和分支一的特征图进行深度可分离卷积运算,再经过1x1的卷积得到DCM的输出。(该模块的核心在于通过Adaptive Pooling得到不同大小的卷积核)
三、滤波器对比

上图为不同的滤波器对比,为了使模型自适应学习适合的卷积核,Inception采用了多卷积通道(每个通道卷积核大小不同)融合的方法,ASPP采用了多空洞卷积通道(每个通道卷积核的Dilation不同)融合的方法,而DCM利用AdaptivePooling来生成卷积核,该方法能够更好的利用上下文信息。
四、实验结果

DMNet在PASCAL和ADE20K数据集上都获得了SOTA效果,在PASCAL验证集上的mIOU为54.4%,ADE20K验证集上的mIOU为45.5%。
五、滤波器实验对比

上图为采用了Inception、ASPP和DCM的分割结果对比,从上图可以看出,受益于DCM的滤波器生成策略,DCM能够更好的利用上下文信息来提升语义分割效果。
六、核心代码
class DCM(nn.Layer): """ Dynamic Convolutional Module used in DMNet. Args: filter_size (int): The filter size of generated convolution kernel used in Dynamic Convolutional Module. fusion (bool): Add one conv to fuse DCM output feature. in_channels (int): Input channels. channels (int): Channels after modules, before conv_seg. """ def __init__(self, filter_size, fusion, in_channels, channels): super().__init__() self.filter_size = filter_size # 滤波器尺寸 self.fusion = fusion # 是否在DCM的输出特征图后面加上一个卷积层 self.channels = channels # 输出通道数 pad = (self.filter_size - 1) // 2 # 计算pad if (self.filter_size - 1) % 2 == 0: self.pad = (pad, pad, pad, pad) else: self.pad = (pad + 1, pad, pad + 1, pad) self.avg_pool = nn.AdaptiveAvgPool2D(filter_size) # 通过自适应池化产生filter的权重 self.filter_gen_conv = nn.Conv2D(in_channels, channels, 1) self.input_redu_conv = layers.ConvBNReLU(in_channels, channels, 1) # 1x1的卷积减少特征图通道 self.norm = layers.SyncBatchNorm(channels) self.act = nn.ReLU() if self.fusion: self.fusion_conv = layers.ConvBNReLU(channels, channels, 1) def forward(self, x): generated_filter = self.filter_gen_conv( self.avg_pool(x)) # 分支二:生成滤波器权重 x = self.input_redu_conv(x) # 分支一:减少特征图通道 b, c, h, w = x.shape x = x.reshape([1, b * c, h, w]) generated_filter = generated_filter.reshape( [b * c, 1, self.filter_size, self.filter_size]) x = F.pad(x, self.pad, mode='constant', value=0) output = F.conv2d(x, weight=generated_filter, groups=b * c) # 深度可分离卷积 output = output.reshape([b, self.channels, h, w]) output = self.norm(output) output = self.act(output) if self.fusion: output = self.fusion_conv(output) return output登录后复制
七、DMNet在线体验
运行以下代码,体验DMNet训练、验证和预测。
step 1: 解压cityscape数据集
step 2: 训练DMNet(本模型复现环境是Tesla V100 * 4,想要完整的训练出复现结果请移步脚本任务)
step 3: 测试DMNet在验证集的效果(这里给出个训练过程中最好的权重验证结果,对应的日志和vdl可视化文件在log和output目录下)
In [ ]# step 1: 解压数据%cd ~/data/data64550!tar -xf cityscapes.tar%cd ~/登录后复制In [ ]
# step 2: 模型训练%cd ~/DMNet_paddle/!python train.py --config configs/dmnet/dmnet_cityscapes_1024x512_100k.yml --num_workers 4 --do_eval --use_vdl --log_iter 20 --save_interval 2000登录后复制In [ ]
# step 3: 模型验证--此处给出了在Tesla V100 * 4环境下训练出的模型权重%cd ~/DMNet_paddle/!python val.py --config configs/dmnet/dmnet_cityscapes_1024x512_100k.yml --model_path output/best_model/model.pdparams登录后复制
八、复现结果
本次论文复现赛要求是Cityscapes 验证集mIOU达到79.64%,本次复现的结果为mIOU 79.67%。
环境:
paddlepaddle==2.2.0
Tesla v100 * 4
九、复现经验
1、如果复现的精度未达到要求,且差距不大,可以尝试增加训练次数(第一次80k训练精度只有79.35%,后来训练100k达到79.88%达到验收标准,最后PR时再训练80K达到79.67%,miou变化是因为未固定随机数种子);
2、为了tipc方便,最好先验证模型能否正常动转静导出再训练(有些代码在动转静导出时会出错,最好先调试导出功能再训练,节省复现时间);
3、优先使用PaddleSeg框架复现论文,可以节省大量的时间,同时能够再PR时提高效率。
相关攻略
常见报错解析:“Access Not Configured”故障排除指南 许多开发者和团队成员在使用OpenClaw集成飞书时,都曾遭遇过一个典型的中断提示:“access not configured”(访问未配置)。该提示会明确显示您的飞书账户ID及一组唯一的配对验证码,并指出需要联系机器人所有
OpenClaw 常用指令大全与使用详解 openclaw status:此命令是查看OpenClaw系统整体健康状态的核心指令,执行后即获取服务运行状况的全面报告,是日常运维的首要诊断工具。 openclaw gateway restart:在修改网关配置后,必须运行此指令以重启网关服务,使配置文
如何通过 OpenClaw 实现 Chrome 浏览器自动化操控 在软件开发与自动化测试领域,持续学习是常态。本文旨在详细介绍如何利用 OpenClaw 连接并控制一个已开启的 Chrome 浏览器实例,实现点击、文本输入、文件上传、页面滚动、屏幕截图以及执行 JavaScript 等自动化操作。整
项目概述 你是否希望将强大的 AI 助手带入日常聊天?本教程将指导你完成搭建流程,让你能在 QQ 上直接调用 OpenClaw 智能助手,实现无门槛的 AI 对话体验。 架构说明 ┌─────────────┐ ┌──────────────┐ ┌─────────────┐ │ QQ 用户 │ ─
一 下载并安装Node js,全程保持默认设置 首先,请前往Node js官方网站的下载中心:https: nodejs org zh-cn download。根据您的操作系统(Windows Mac Linux)下载对应的安装程序。运行安装向导时,整个过程非常简单,您只需连续点击“下一步”按钮
热门专题
热门推荐
曙光英雄青木全面攻略:技能解析、连招技巧与出装思路 在《曙光英雄》中,青木是位列T1梯度的顶尖刺客,其强度与机动性仅次于版本强势英雄飞廉。凭借高额的瞬间爆发伤害,以及集隐身、位移、免伤于一体的全能机制,他能够有效掌控战场节奏,成为对手后排的梦魇。本文将为你深度解析这位“幻影刺客”的技能机制、实战技巧
《三国杀:武将觉醒》新手专武和锦囊选择全攻略 当角色等级达到30至35级,游戏核心的专武与锦囊系统随之解锁。这无疑是前期养成的重要分水岭:选择得当能带来立竿见影的战力飞跃,决策失误则会浪费宝贵资源,拖慢游戏进度。本攻略将为你详细解析,帮助各位主公高效构建阵容,走好养成第一步。 首先要掌握一个关键信息
三国志王道天下盾兵阵容深度解析 在策略手游《三国志:王道天下》中,一套强力的阵容往往能让你在沙场上所向披靡。最近,许多玩家都在探讨如何构建一支攻防兼备的盾兵队伍。本文将为你全面拆解一套经过PVP与PVE双重考验的顶尖盾兵阵容体系,从配置到机制,助你打造坚不可摧的防御核心。 阵容核心构成与战略定位 本
双十一购物节来袭,爱奇艺多重福利重磅开启! 海量影视限时特惠 今年的双十一,爱奇艺将海量优质影音资源纳入超值促销。无论是刚刚下映的院线热门大片、全网刷屏的爆款电视剧,还是口碑载道的独家王牌综艺,均推出了前所未有的心动折扣。这意味着您无需支付高昂的影院票价,也无需为多平台会员费烦恼,居家即可轻松搭建个
《梦境护卫队》×《葫芦兄弟》2024联动活动完整攻略:奖励领取与资源规划指南 备受期待的《梦境护卫队》与经典国漫《葫芦兄弟》官方联动现已正式开启!本次活动为玩家带来了丰富的限定奖励与趣味玩法,社区热度持续攀升。无论你是追求收藏还是提升战力,这份详尽的奖励解析与高效获取攻略,都将帮助你轻松领满全部免费





