智慧农业赛题——牛只图像分割竞赛
本文围绕牛只图像分割竞赛展开,介绍赛题背景、任务及数据情况,包括训练集和A、B榜测试集,标注文件为COCO格式的json。还阐述了数据处理、环境准备、数据集划分与定义,以及使用Mask RCNN模型训练和预测的过程,经80个epoch训练提交结果约0.2。

一、智慧农业赛题——牛只图像分割竞赛
比赛地址:https://www.dcic-china.com/competitions/10021
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
参考geoyee大佬: https://aistudio.baidu.com/aistudio/projectdetail/3452878
1.赛题简介
赛题名称: 牛只图像分割竞赛
出题单位: 深圳喜为智慧科技有限公司
赛题背景: 牛只图像分割是智慧畜牧中的重要一环,既实现牛只的智能个体识别,还能掌握牛在养殖过程中的生长状况。本赛题旨在用人工智能为畜牧养殖赋能,使用机器代替饲养员对牛只进行个体识别,节约人力成本,同时快速获取牛只的体格信息数据,作为后续牛只体型评价、健康评价等的重要参考依据。
赛题任务: 本赛题以牛只实例分割图像数据作为训练样本,参赛选手需基于训练样本构建模型,对提供的测试集中的牛只图像进行实例分割检测。任务方法不局限于实例分割等方案,训练数据集不局限于提供的数据,可以加入公开的数据集。
2.数据简介
此次比赛分为A榜和B榜两个评测集,以及提供200张带标注信息的训练数据,每张训练数据都是包含一个场景下多只牛的图像,并对当前场景中的牛只进行了标注;A. A榜提供的测试集:100张标注图像;B. B榜提供的测试集:100张标注图像;3.数据说明
本次比赛标注文件中的类别为1类,为牛只,标注的文件格式为json格式,内容格式参照coco数据集标注格式。一个数据集对应一个图片文件夹一个json文件,json文件格式和A榜B榜json文件格式相同,内容格式具体如下:
1、“image”图片描述信息,包含多张图片的id与图片类型、名称信息。
“image”:[{“id”: int,#图片id编号“_id”: str,#图片_id编号“file_name”: str,#图片路径或名称“height”: int,#图片高度“width”: int, #图片宽度“type”: “jpg”#图片类型},{…},{…}]登录后复制2、“categories”类别描述信息,包含类别名称和类别id,该数据集仅为一类,为牛只。
“categories”: [{“supercategory”: “object”,#父类别“name”: “cow”,#类别名称“id”: 1 #类别对应id}]登录后复制3、“annotations”标注描述信息,包含标注对应的图片标识id,标注的坐标信息等。
“annotations”:[{“_id”:str,#对应图片_id编号“id”:int,#目标标号“image_id”:int,#对应图片id编号“iscrowd”:int,#固定值0“bbox”:list,#目标定位框[x,y,w,h]“area”:float,#目标面积“segmentation”:list,#实例分割坐标[x1,y1,x2,y2,…]“category_id”:int#类别标识id},{…},{…}]登录后复制4.提交示例
参赛者通过提供的测试数据集图片得出具体的实例分割坐标,提交格式为json文本,utf-8编码,整体为一个数组格式,参考coco的实例分割的输出格式。
[{“image_id”:“images/611e27ff656be64fad34087f.webp”,“category_id”:18,“segmentation”:{“size”:[2560,1440],“counts”:“xxx”},“score”:0.236},{…},…]登录后复制二、数据处理
主要是解压缩并查看数据
In [ ]!unzip -qoa data/data127515/train_dataset.zip -d train登录后复制In [ ]
!unzip -qoa data/data127515/test_dataset_A.zip -d test登录后复制In [ ]
from PIL import Imageimg=Image.open('train/200/images/60ac8ef2b7f3a3763b8340af.webp')img登录后复制登录后复制
三、环境准备
建议使用PaddleX,虽然都是COCO格式的json,但是实际上PaddleDetection的COCO的格式要求更严格,而PaddleX的COCO格式相对来说没那么严格,不用再进行数据处理。
In [ ]!pip install paddlex登录后复制
四、数据集处理
1.数据集划分
按照 8:2划分train和eval
In [ ]!mv train/200/data.json train/200/annotations.json登录后复制In [ ]
!paddlex --split_dataset --format COCO --dataset_dir train/200 --val_value 0.2登录后复制In [ ]
!ls train/200登录后复制
annotations.json images train.json val.json登录后复制
2.统计mean和std
In [ ]# 统计mean和stdimport osimport cv2import numpy as npfrom tqdm import tqdmimg_list_1440 = []img_list_576 = []means = np.zeros(3)stdevs = np.zeros(3)imgs_path = "train/200/images"imgs_name = os.listdir(imgs_path)for idx, name in tqdm(enumerate(imgs_name)): if name == ".ipynb_checkpoints": continue img = cv2.cvtColor(cv2.imread(os.path.join(imgs_path, name)), cv2.COLOR_BGR2RGB) img = img[:, :, :, np.newaxis] if img.shape[0] == 1440: img_list_1440.append(img) else: img_list_576.append(img)for img_list in [img_list_1440, img_list_576]: imgs = np.concatenate(img_list, axis=-1) imgs = imgs.astype(np.float32) / 255. for i in tqdm(range(3)): pixels = imgs[:, :, i, :].ravel() means[i] += float(np.mean(pixels)) stdevs[i] += float(np.std(pixels))print(means / 2, stdevs / 2)登录后复制
3.定义数据集
In [1]# 准备数据集import paddlex as pdxfrom paddlex import transforms as Ttrain_transforms = T.Compose([ T.MixupImage(mixup_epoch=-1), T.RandomDistort(), T.RandomExpand(im_padding_value=[123.675, 116.28, 103.53]), T.RandomCrop(), T.RandomHorizontalFlip(), T.BatchRandomResize( target_sizes=[320, 352, 384, 416, 448, 480, 512, 544, 576, 608], interp="RANDOM"), T.Normalize( mean=[0.46157165, 0.46698335, 0.46580717], std=[0.28069802, 0.28096266, 0.28323689])])eval_transforms = T.Compose([ T.Resize( target_size=608, interp="CUBIC"), T.Normalize( mean=[0.46157165, 0.46698335, 0.46580717], std=[0.28069802, 0.28096266, 0.28323689])])train_dataset = pdx.datasets.CocoDetection( data_dir="train/200", ann_file="train/200/train.json", transforms=train_transforms, shuffle=True)eval_dataset = pdx.datasets.CocoDetection( data_dir="train/200", ann_file="train/200/val.json", transforms=eval_transforms)登录后复制
五、模型训练
使用 Mask RCNN 模型,Mask RCNN沿用了Faster RCNN的思想,特征提取采用ResNet-FPN的架构,另外多加了一个Mask预测分支。集成了物体检测和实例分割两大功能,并且在性能上上也超过了Faster-RCNN。

具体可参考小度熊分隔; https://gitee.com/paddlepaddle/PaddleX/blob/release/2.1/tutorials/train/instance_segmentation/mask_rcnn_r50_fpn.py
1.PaddleX模型
2.PaddleDetection模型
3.模型训练
采取ResNet50_vd作为Backbone,开始训练,训练较为耗时。
In [2]import numpy as npimport paddlex as pdxfrom paddlex import transforms as T# 初始化模型并进行训练num_classes = len(train_dataset.labels)model = pdx.det.MaskRCNN( num_classes=num_classes, backbone="ResNet50_vd") model.train( num_epochs=200, train_dataset=train_dataset, train_batch_size=20, eval_dataset=eval_dataset, pretrain_weights="COCO", learning_rate=0.005 / 12, warmup_steps=500, warmup_start_lr=0.0, save_interval_epochs=5, lr_decay_epochs=[85, 135], save_dir="output/maskrcnn_r50vd", use_vdl=True)登录后复制
4.预测并提交
In [ ]# 预测import osimport os.path as ospimport jsonimport numpy as npimport paddlex as pdxfrom tqdm import tqdmfrom pycocotools import mask as maskUtilsdef binary_mask_to_rle(binary_mask): binary_mask = np.asfortranarray(binary_mask) rle = maskUtils.encode(binary_mask) rle["counts"] = str(rle["counts"], encoding="utf-8") return rlemodel = pdx.load_model("output/maskrcnn_r50vd/best_model")test_path = "test/images/"test_name = os.listdir(test_path)res_json = []for name in tqdm(test_name): path = osp.join(test_path, name) if path.split(".")[-1] != "png": continue result = model.predict(path) for res in result: # print(res) # print(50*'*') res_json.append({ "image_id": osp.join("images", name), "category_id": 1, "segmentation": binary_mask_to_rle(res["mask"]), "score": res["score"] }) # pdx.det.visualize(image_name, result, threshold=0.5, save_dir="./output_picture/maskrcnn_r50vd")with open("test.json", "w", encoding="utf-8") as f: json.dump(res_json, f)登录后复制经过80个epoch训练提交结果为0.2左右

相关攻略
FDUSD脱锚惊魂夜:币安生态稳定币的信任危机与系统性风险 2025年4月2日夜间,加密货币市场经历了一场突如其来的“压力测试”。由香港First Digital Trust Limited发行的美元稳定币FDUSD,在市场上演了惊心动魄的脱锚跳水,其兑USDT价格一度暴跌至0 8726美元。这场震
最近又折腾了下 Obsidian 的 Git 插件,虽然也有点麻烦,但它是适合我的。下面介绍下怎么配置和使用。 第一次使用 Obsidian 是在 2024 年,这是翻阅之前的文章 《Obsidia
这项由华为技术有限公司、南洋理工大学、香港大学和香港中文大学联合完成的突破性研究发表于2026年1月,论文编号为arXiv:2601 01426v1。研究团队通过一种名为SWE-Lego的创新训练方
12 月 27 日消息,科技媒体 NeoWin 今天(12 月 27 日)发布博文,报道称 AI 代码编辑器 Windsurf 本周发布 Wave 13 版,通过大幅升级多智能体工作流、性能可访问
NEO(小蚁区块链)旨在构建智能经济网络。NEO通过资产数字化和智能合约实现自动化管理,用户需在支持NEO交易的平台注册账户并获取数字货币,选择合适的交易对后,即可下单交易并确认。交易完成后,可在账户中查看NEO资产,或转移至个人数字储存中安全保管NEO。
热门专题
热门推荐
4月3日消息,今日,vivo年度影像旗舰X300 Ultra正式开售,新机定位专业V单+口袋摄影机,影像能力全面拉满。vivo X300 Ultra配备蔡司大师镜头群,覆盖14mm蔡司超广角、35m
4月2日消息,微软资深Windows工程师Raymond Chen发布长文,呼吁用户和企业IT团队,不要每次在系统出现问题后就第一时间将责任归咎于Windows更新。Chen指出,许多被归咎于每月更
近期,日本玩家围绕卡普空旗下女性角色视觉风格的变迁展开了广泛讨论。有玩家将十年前以当时技术水准塑造的代表性美少女角色玛莉·萝丝,与近年运用最新技术打造的英格丽德进行对比,认为后者在角色表现力上并未体
有多少资深玩家还记得AQUAPLUS旗下那款经典的恋爱冒险作品ToHeart?多年来,关于推出第三部续作的呼声始终不绝于耳。然而,这一计划事实上已被官方终止。近日,该公司社长在一次访谈中透露了项目搁
2026年4月5日,电动自行车行业正面临双重压力:国家层面的以旧换新补贴政策正式退出,叠加原材料成本持续攀升,导致终端售价普遍上调,市场销售明显承压。根据2026年最新实施的消费品以旧换新政策,电动





