张YOLO人脸多类型皮肤瑕疵智能检测数据集

时间：2026-06-29 15:21

一套包含3000张高分辨率标注图像的人脸皮肤瑕疵检测数据集，采用YOLO格式，覆盖黑眼圈、痤疮疤痕、黑头、色斑、炎症、丘疹、白头、皱纹8类瑕疵，多肤色多光照采集，适用于智能美妆与医美辅助诊断。

人脸皮肤瑕疵检测技术，近年来在智能美妆、医美辅助诊断以及皮肤健康管理等领域，已从概念探讨快速演进为实际落地的刚性需求。然而，目前市面上公开的皮肤瑕疵数据集普遍存在类别覆盖不全、场景单一等问题，能同时兼容多肤色、多光照条件及多种瑕疵类型的高质量数据资源极为稀缺。本文介绍的这套人脸皮肤瑕疵检测数据集，正是专为破解这一痛点而精心构建的。

本数据集专为高精度面部皮肤分析与智能检测场景打造，是一个多目标检测数据集，核心任务是对面部常见皮肤瑕疵进行精准识别与定位。数据集总计包含3000张高分辨率人工标注图像，覆盖色素沉着、炎症反应、结构老化等三大类皮肤问题，可直接用于YOLOv5、YOLOv8、YOLOv10、YOLOv11、Faster R-CNN、SSD、RetinaNet等主流目标检测模型的训练、验证与测试。

在这里插入图片描述

随着智能美妆、皮肤健康管理及医美辅助诊断技术的快速发展，基于计算机视觉实现面部皮肤瑕疵的自动识别、分类与定位，已成为美妆科技与数字医疗行业的关键技术方向。该数据集充分考虑了面部皮肤检测中瑕疵尺度差异大、形态多样、肤色与光照环境复杂等实际挑战，进行了针对性的优化设计，能够为智能美妆APP、皮肤健康管理平台、医美辅助诊断系统以及皮肤科AI研究提供高质量的数据支撑。

二、数据集基本信息

项目	内容
数据集名称	人脸多类型皮肤瑕疵智能检测数据集
数据规模	3000张高分辨率标注图像
任务类型	目标检测（Object Detection）
检测目标	黑眼圈/眼袋、痤疮疤痕、黑头、色斑/晒斑、炎症/红肿、丘疹/脓疱、白头粉刺、皱纹等
类别数量（nc）	8类（经语义聚类统一后）
标注方式	Bounding Box目标框标注
数据格式	YOLO标准格式
数据来源	真实人脸多肤色、多光照、多角度采集
数据划分	Train / Valid / Test
适配模型	YOLOv5、YOLOv8、YOLOv10、YOLOv11、Faster R-CNN、SSD等

在这里插入图片描述

三、数据集类别说明

原始标注共包含19个标签条目，但仔细梳理后会发现，重复及大小写不一致的问题较为普遍。为构建高效的检测模型，建议将类别聚类为8个语义类别，覆盖面部常见的色素沉着、炎症反应与结构老化三大类皮肤问题。聚类后的类别体系如下：

类别配置（建议统一后）

nc: 8
names:
  - dark_circle_eyebag
  - acne_scar
  - blackhead
  - dark_spot_freckle_melasma
  - skin_redness_inflammation
  - nodule_papule_pustule
  - whitehead
  - wrinkle

类别详情

类别ID	类别名称	英文名称	原始标签来源（需统一映射）	类别说明
0	黑眼圈/眼袋	dark_circle_eyebag	Dark Circle, Dark circle, Eyebag	眼周色素沉着或脂肪膨出
1	痤疮疤痕	acne_scar	acne scar	痘痘愈合后留下的疤痕
2	黑头	blackhead	blackhead, blackheads	毛孔堵塞形成的氧化皮脂
3	色斑/晒斑	dark_spot_freckle_melasma	dark spot, darkspot, freckle, melasma	包括雀斑、晒斑、黄褐斑等色素沉积
4	炎症/红肿	skin_redness_inflammation	fiery, skinredness, vascular	皮肤发红、血管扩张或急性炎症
5	丘疹/脓疱	nodule_papule_pustule	nodules, papules, pustules	不同类型的炎性痘痘
6	白头粉刺	whitehead	whitehead, whiteheads	闭合性粉刺
7	皱纹	wrinkle	wrinkle	面部细纹或静态纹

多类别细粒度设计的优势在于，模型能够更精准地区分不同类型与严重程度的皮肤瑕疵，尤其适用于智能测肤、医美辅助诊断及护肤效果评估等专业应用场景。

在这里插入图片描述

四、数据集结构说明

数据集采用标准YOLO目录结构组织，并按照常规机器学习规范划分为三部分，可直接用于目标检测模型的训练，无需额外格式转换。

database/
└── 人脸18种皮肤瑕疵智能检测数据集
    ├── train
    │   └── images
    ├── valid
    │   └── images
    └── test
        └── images

各部分功能明确：train/images 用于模型的特征学习与权重更新；valid/images 用于超参数调优、早停监控及防止过拟合；test/images 用于最终模型性能的客观评估。所有标注文件均采用标准YOLO格式，与图像文件一一对应，无需格式转换即可直接调用。

五、数据集核心优势

1. 真实人脸多场景采集

所有数据均来源于真实人脸图像采集，覆盖不同肤色、光照条件、拍摄角度及面部遮挡情况，能够真实反映智能测肤与医美辅助诊断的实际应用环境。具体覆盖维度如下：

不同肤色类型（浅色、中等、深色）
不同年龄段（青年、中年、老年）
不同性别（男性、女性）
不同肤质类型（干性、油性、混合性、敏感性）
不同拍摄环境（室内自然光、室内灯光、户外）

这些因素的多样性综合起来，能够显著提升模型在实际部署环境中的表现性能。

2. 多尺度瑕疵目标覆盖

面部皮肤瑕疵在图像中呈现出显著的尺度差异——从细微的毛孔级到明显的片状区域，跨度极大。数据集中包含：

细微瑕疵（黑头、白头、雀斑等小尺度目标）
中等瑕疵（痘疤、丘疹、色斑等中尺度目标）
显著瑕疵（红肿、炎症、眼袋等大尺度目标）
孤立瑕疵与密集瑕疵集群

这种设计能够有效提升模型对不同尺度瑕疵目标的检测能力，避免“小目标漏检、大目标误检”等常见问题。

3. 丰富的皮肤问题类型覆盖

数据覆盖三大类皮肤问题：

色素沉着类：雀斑、晒斑、黄褐斑、黑眼圈等
炎症反应类：红肿、血管扩张、丘疹、脓疱、结节等
结构老化类：皱纹、眼袋、疤痕等

类别覆盖面广，能够有效增强模型在多种皮肤问题复合场景中的鲁棒性与泛化能力。

4. 高质量专业标注

所有图像均由经过专业培训的标注人员进行精细化标注，并经过多轮审核校验，确保不同瑕疵边界的精确性；覆盖细微与显著瑕疵的精准定位；边界框紧密贴合瑕疵区域；无漏标；无类别混淆。这些细节直接决定了模型训练的初始质量。

5. 强泛化能力

数据集涵盖了不同面部特征与面部朝向、不同表情状态、不同面部遮挡（如眼镜、刘海、口罩）、不同光照条件及拍摄距离。这些多样性能够大幅提升模型在实际皮肤分析任务中的泛化能力——换言之，模型在实验室环境下表现优秀仅是起点，在用户手机前置摄像头拍出的真实场景中依然保持稳定，才是真正的考验。

六、适用场景

智能美妆APP/AI测肤

为用户提供个性化的皮肤问题诊断报告、肤质评估及定制化护肤建议。

医美辅助诊断系统

辅助医生对面部瑕疵进行定位、面积估算及严重程度分级，有效提升诊疗效率。

护肤品效果验证

量化评估护肤品使用前后皮肤瑕疵面积与数量的变化，为护肤效果提供客观数据支撑。

皮肤健康管理平台

作为皮肤健康管理系统的核心视觉感知模块，支持日常肤质跟踪与问题预警。

面部识别预处理

在人脸识别前去除皮肤瑕疵干扰，提升人脸识别系统的准确率与鲁棒性。

皮肤科人工智能研究

为皮肤科人工智能研究提供高质量标注数据，推动计算机辅助诊断技术的进步与发展。

在这里插入图片描述

七、适用研究方向

从研究角度看，本数据集可应用于多个方向：面部皮肤瑕疵检测、多尺度目标检测、细粒度目标检测与分类、医学图像目标检测、智能美妆与肤质分析算法、YOLO系列模型优化、轻量化检测模型、数据不平衡与标签噪声处理、域适应与跨数据集泛化、面部图像分析、计算机辅助诊断、护肤品功效量化评估等。无论是工程落地还是学术研究，都能从中找到合适的切入点。

八、总结

人脸多类型皮肤瑕疵智能检测数据集（Facial Skin Defect）包含3000张高分辨率标注图像，采用标准YOLO格式构建，专注于面部皮肤瑕疵的智能识别与定位。数据集覆盖黑眼圈/眼袋、痤疮疤痕、黑头、色斑/晒斑、炎症/红肿、丘疹/脓疱、白头粉刺、皱纹等8类核心皮肤问题，具备瑕疵尺度跨度大、肤色与场景多样性高、专业标注精准等特点，可广泛应用于智能美妆、医美辅助诊断、皮肤健康管理、护肤品效果验证等场景，是开展面部皮肤分析算法研发与智慧美妆系统建设的优质数据资源。

来源：https://developer.aliyun.com/article/1743942

健康管理

上一篇阿里云2026秒杀 2核4G200M带宽轻量服务器38元/年 下一篇张钢材锈蚀缺陷YOLO目标检测数据集

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网