讯飞2022-LED灯的色彩和均匀性检测挑战赛得分0.905
本文介绍讯飞2024年LED灯色彩和均匀性检测挑战赛的解决方案。使用PaddleClas套件的HRNet_W18_C模型,通过解压含中文路径的数据集,对负样本进行翻转等增强,调整正负样本比例至1:1,按8:1分训练集和测试集,训练后得0.90574分暂列第四。还提及可尝试更多模型和数据增强方法提分。

讯飞-2024:LED灯的色彩和均匀性检测挑战赛
赛题描述: 工业自动化质检成为了当下主流与趋势,在整个质检中视觉质检又是重中之重。使用AI的先进视觉技术应用在工业质检领域。
比赛任务: 根据提供的数据集,来预测测试集的数据是否为良品(颜色,缺损和是否成像均匀)。
本项目特点: 无需修改代码,及其容易上手,且能够一举获得高分
数据集示例:
正样本:
负样本:
分析
由上图可以看出,LED的质检,主要是判断LED光环的完整性和光滑性,并不存在特别复杂的特征,对于大型分类模型,在这样的数据集上表现可能并不佳,因此,我们选择 HRNet_W18_C 模型进行训练。
PaddleClas介绍
飞桨图像识别套件 PaddleClas 是飞桨为工业界和学术界所准备的一个图像识别和图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。
PaddleClas为使用者提供了大量的优质模型,详细模型信息可参考: 链接
本Baseline采用PaddleClas套件进行训练,在讯飞提交界面获得了0.90574的分数,暂列 4/17 .
与第一名差距极小,文末将会介绍提分方法
解压数据集
由于数据集取材于原始比赛界面,故含有中文路径,在解压后会显示乱码,但不影响程序的读取。
In [ ]!unzip -oq data/data153476/LED灯的色彩和均匀性检测挑战赛公开数据.zip -d data/登录后复制
数据集增强(初步)
通过观察数据集,正样本数量达到了451张,负样本数据只有41张,两种数据相差十倍,故首先使用翻转等简单操作增强负样本数据。
增强后的数据集存储在intensify文件夹下
In [ ]import osimport cv2bad_path = 'data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┤╬╞╖'a = os.listdir(bad_path)for i in a: if i[-4:] != '.webp': continue print(bad_path+'/'+i) img = cv2.imread(bad_path+'/'+i) cv2.imwrite( './intensify/'+i, img) img_flip = cv2.flip(img, 1) cv2.imwrite( './intensify/'+i[:-4]+'1.webp', img_flip) img_transpose = cv2.transpose(img) cv2.imwrite('./intensify/'+i[:-4]+'2.webp', img_transpose) img_flip = cv2.flip(img_transpose, 1) cv2.imwrite('./intensify/'+i[:-4]+'3.webp', img_flip) img_flip = cv2.flip(img_transpose, -1) cv2.imwrite('./intensify/'+i[:-4]+'4.webp', img_flip)登录后复制 创建数据集列表
读取原始正样本数据和增强后的负样本数据,由于正样本数据相互之间差异不大,故我们进读取其中一半图像,使得正负样本之间比例近似为1: 1
再通过随机分配的方式按1: 8的比例裁减为测试集和训练集
In [32]import osimport randombad_path = 'intensify'good_path = 'data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┴╝╞╖'bad_imgs = os.listdir(bad_path)good_imgs = os.listdir(good_path)with open('datasets.txt', 'w') as f: for i in bad_imgs: if i[-4:] != '.webp': continue s = bad_path+'/'+i+' '+'1\n' f.writelines(s) tot = 0 for i in good_imgs: tot += 1 if tot >= 200: break if i[-4:] != '.webp': continue s = good_path+'/'+i+' '+'0\n' f.writelines(s)with open('datasets.txt','r') as f: a = f.readlines() with open('train.list','w') as ff: with open('valid.list','w') as fff: for i in a: n = random.randint(0, 9) if n >= 8: fff.write(i) else: ff.write(i)登录后复制 克隆PaddleClas
最新版本为2.4版本,但本人习惯了2.3版本,新版本中包含了一些新加入的模型,可以进一步尝试
In [ ]!git clone https://github.com/PaddlePaddle/PaddleClas.git --branch release/2.3登录后复制
安装依赖
将修改后的配置文件放入PaddleClas
将修改后的预测文件放入engine,此文件可以直接生成submit所需的csv文件
In [ ]!pip install -r PaddleClas/requirements.txt!cp HRNet_W18_C.yaml PaddleClas/ppcls/configs/ImageNet/HRNet/!cp engine.py PaddleClas/ppcls/engine/登录后复制
训练
由于数据集少且模型较小,训练可以在几十分钟内完成
In [ ]!python PaddleClas/tools/train.py \ -c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml \ # -o Arch.pretrained=output/EfficientNetB4/best_model \ -o Global.device=gpu登录后复制
预测
预测完成后会在主目录下生成test.csv文件,下载后前往讯飞赛题界面上传即可
In [ ]!python PaddleClas/tools/infer.py \ -c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml \ -o Global.pretrained_model=output/HRNet_W18_C/best_model登录后复制
改进方法:
PaddleClas套件提供了大量的模型,可以尝试更多相似大小的模型或者更好的方法,HRNet_W18_C是本人以直觉选取的方案,并不是最优数据增强方面仅使用了图像翻转,且翻转的方向不全,可以进一步增强数据后重复训练相关攻略
零基础学习Python可从安装环境开始。前往官网下载最新稳定版,安装时勾选添加PATH选项。验证安装后,创建 py文件并写入print()函数输出文本。通过命令行运行文件,观察输出结果。理解代码按顺序执行,注意括号与引号的正确使用。初期不必死记语法,通过修改代码并运行来建立动手反馈的实践感。
Trae的AI功能深度适配FastAPI与Flask框架。针对FastAPI,它能精准识别异步架构与类型注解,提供模型定义、路由补全及异步数据库建议;在Flask中,则侧重理解装饰器链、请求上下文与ORM操作,辅助完成权限控制与数据库提交等典型模式。此外,Trae具备跨框架语义索引能力,可感知项目结构、依赖变更与工具函数调用,提升开发效率。
Trae在Python数据分析与机器学习项目中主要通过四种方式提供支持:利用Auto模式自动生成并执行端到端分析脚本;通过AgentCLI命令行自动化机器学习建模流程;对现有代码进行智能调试与优化;借助语音交互快速构建数据处理函数。这些功能覆盖了从需求描述到代码生成、模型构建及代码优化的全流程。
在Python编程中,你是否也曾编写过类似的统计代码? 统计词频 count = {} for word in words: if word in count: count[word] += 1 else: count[word] = 1 实际上,这种高频的计数需求,完全可以通过Python内置
Trae稳定支持Python3 10至3 13版本,3 9及以下版本无法运行。Python3 14处于实验性支持阶段,核心功能可能受限。当存在多个3 10以上版本时,Trae优先选择虚拟环境中的解释器,其次为最高系统版本。此外,Trae仅兼容64位Python解释器,不支持32位架构。
热门专题
热门推荐
摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成,并已由人工审核。 随着企业数字化转型进入智能体(Agent)驱动的新阶段,如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》(等保2 0)的严格框架下,企业级智能体的部署必须同时满足效率提升与合规保障的双
使用情景 对于外贸从业者来说,年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划,既要系统梳理过去一年的业绩成果与经验得失,也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天,一份逻辑严谨、数据详实、洞察深刻的总结报告,不仅是个人专业能力的集中体现,更是赢得管理层支
使用情景 又到年末了,年度安全工作总结是每个团队都绕不开的环节。这份总结的价值,远不止于一份简单的回顾。它更像是一份“体检报告”,清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好,哪里还有隐患,从而为来年的精准施策打下坚实的基础。 不过,说起写总结、做PPT,不少人就开始头疼了:内容怎么组织
Zcash (ZEC) 月度暴涨520%:深度解析后市行情与关键点位 近期,隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情,月度涨幅高达520%,价格一度逼近300美元,创下自2021年12月以来的新高。在加密市场整体承压的背景下,ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分
在存量竞争的时代,电商售后数据早已超越了“成本中心”的单一角色,它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而,现实往往骨感:多平台、多店铺、多套ERP系统并存,数据散落一地。靠人工手动汇总?不仅耗时费力,更关键的是,你永远无法实现真正的实时预警与敏捷响应。那么,电商售后数据





