基于YOLOv11m_GAM_Attention的肺结节检测系统
这篇文章全面介绍了一个基于改进YOLOv11的肺结节检测系统,涵盖项目结构、功能特点、部署运行流程、模型性能对比以及架构创新细节。如果你从事医学影像检测相关工作,或对YOLO系列模型的注意力机制优化感兴趣,这里提供了大量实用参考信息。
项目结构
本项目在Ultralytics官方代码基础上进行了适配与扩展,完整的目录结构如下:

功能特点
该系统围绕CT图像中的肺结节检测任务设计,核心功能覆盖从输入到输出的完整链路:支持PNG、JPG、JPEG格式的肺部CT图像上传;检测环节采用YOLOv11m_GAM_Attention模型,输出带有目标框、类别和置信度的可视化结果,并实时统计检测耗时与目标数量。在数据输出方面,不仅提供每个目标的位置坐标(xmin, ymin, xmax, ymax)、类别和置信度详情,还可一键导出CSV格式的检测报告,便于后续分析或存档。
安装与运行
环境部署步骤:
整个部署流程清晰简洁,几步即可完成:
- 安装依赖:
- 文件准备:将GAMA_YOLO11m模型权重放置于项目根目录,中文字体放入
static/fonts/目录。 - 创建必要目录:
- 启动服务:
- 访问系统:
使用说明
打开系统后,通过主页的“选择文件”按钮上传CT图像,系统会自动处理并显示检测结果。在结果页上,可以通过目标选择器切换查看不同类别的检测情况,底部展示详细的检测数据表格。如需保存结果,点击“保存”按钮即可导出CSV报告;任务完成后,点击“退出”安全关闭系统。
YOLOv11m_GAM_Attention模型
性能对比表:
下表将改进模型与基准模型进行了对比,直观展示GAM注意力机制带来的性能提升:
模型架构创新:
该模型的核心改进在于引入了GAM(Global Attention Mechanism,全局注意力机制)模块,专门针对肺结节检测任务进行了优化。注意力机制包含两个子模块:通道注意力采用3D排列加双层MLP结构,空间注意力则基于卷积实现空间信息融合。设计上避免了最大池化操作以减少信息损失,同时利用分组卷积和通道混洗来控制参数增长。该模块被集成在P3、P4、P5三个特征层上,效果显著——对小目标的检测灵敏度明显提升。相比基准YOLOv11m,mAP50提高了3.4个百分点,达到0.888。参数量和计算量虽有所增加(从20M增至23.9M,FLOPs从67.6B增至80.2B),但考虑到实际检测精度的显著提升,这一代价是值得的。
