人脸皮肤瑕疵检测技术,近年来在智能美妆、医美辅助诊断以及皮肤健康管理等领域,已从概念探讨快速演进为实际落地的刚性需求。然而,目前市面上公开的皮肤瑕疵数据集普遍存在类别覆盖不全、场景单一等问题,能同时兼容多肤色、多光照条件及多种瑕疵类型的高质量数据资源极为稀缺。本文介绍的这套人脸皮肤瑕疵检测数据集,正是专为破解这一痛点而精心构建的。
本数据集专为高精度面部皮肤分析与智能检测场景打造,是一个多目标检测数据集,核心任务是对面部常见皮肤瑕疵进行精准识别与定位。数据集总计包含3000张高分辨率人工标注图像,覆盖色素沉着、炎症反应、结构老化等三大类皮肤问题,可直接用于YOLOv5、YOLOv8、YOLOv10、YOLOv11、Faster R-CNN、SSD、RetinaNet等主流目标检测模型的训练、验证与测试。

随着智能美妆、皮肤健康管理及医美辅助诊断技术的快速发展,基于计算机视觉实现面部皮肤瑕疵的自动识别、分类与定位,已成为美妆科技与数字医疗行业的关键技术方向。该数据集充分考虑了面部皮肤检测中瑕疵尺度差异大、形态多样、肤色与光照环境复杂等实际挑战,进行了针对性的优化设计,能够为智能美妆APP、皮肤健康管理平台、医美辅助诊断系统以及皮肤科AI研究提供高质量的数据支撑。
二、数据集基本信息
| 项目 | 内容 |
|---|---|
| 数据集名称 | 人脸多类型皮肤瑕疵智能检测数据集 |
| 数据规模 | 3000张高分辨率标注图像 |
| 任务类型 | 目标检测(Object Detection) |
| 检测目标 | 黑眼圈/眼袋、痤疮疤痕、黑头、色斑/晒斑、炎症/红肿、丘疹/脓疱、白头粉刺、皱纹等 |
| 类别数量(nc) | 8类(经语义聚类统一后) |
| 标注方式 | Bounding Box目标框标注 |
| 数据格式 | YOLO标准格式 |
| 数据来源 | 真实人脸多肤色、多光照、多角度采集 |
| 数据划分 | Train / Valid / Test |
| 适配模型 | YOLOv5、YOLOv8、YOLOv10、YOLOv11、Faster R-CNN、SSD等 |

三、数据集类别说明
原始标注共包含19个标签条目,但仔细梳理后会发现,重复及大小写不一致的问题较为普遍。为构建高效的检测模型,建议将类别聚类为8个语义类别,覆盖面部常见的色素沉着、炎症反应与结构老化三大类皮肤问题。聚类后的类别体系如下:
类别配置(建议统一后)
nc: 8
names:
- dark_circle_eyebag
- acne_scar
- blackhead
- dark_spot_freckle_melasma
- skin_redness_inflammation
- nodule_papule_pustule
- whitehead
- wrinkle
类别详情
| 类别ID | 类别名称 | 英文名称 | 原始标签来源(需统一映射) | 类别说明 |
|---|---|---|---|---|
| 0 | 黑眼圈/眼袋 | dark_circle_eyebag | Dark Circle, Dark circle, Eyebag | 眼周色素沉着或脂肪膨出 |
| 1 | 痤疮疤痕 | acne_scar | acne scar | 痘痘愈合后留下的疤痕 |
| 2 | 黑头 | blackhead | blackhead, blackheads | 毛孔堵塞形成的氧化皮脂 |
| 3 | 色斑/晒斑 | dark_spot_freckle_melasma | dark spot, darkspot, freckle, melasma | 包括雀斑、晒斑、黄褐斑等色素沉积 |
| 4 | 炎症/红肿 | skin_redness_inflammation | fiery, skinredness, vascular | 皮肤发红、血管扩张或急性炎症 |
| 5 | 丘疹/脓疱 | nodule_papule_pustule | nodules, papules, pustules | 不同类型的炎性痘痘 |
| 6 | 白头粉刺 | whitehead | whitehead, whiteheads | 闭合性粉刺 |
| 7 | 皱纹 | wrinkle | wrinkle | 面部细纹或静态纹 |
多类别细粒度设计的优势在于,模型能够更精准地区分不同类型与严重程度的皮肤瑕疵,尤其适用于智能测肤、医美辅助诊断及护肤效果评估等专业应用场景。

四、数据集结构说明
数据集采用标准YOLO目录结构组织,并按照常规机器学习规范划分为三部分,可直接用于目标检测模型的训练,无需额外格式转换。
database/
└── 人脸18种皮肤瑕疵智能检测数据集
├── train
│ └── images
├── valid
│ └── images
└── test
└── images
各部分功能明确:train/images 用于模型的特征学习与权重更新;valid/images 用于超参数调优、早停监控及防止过拟合;test/images 用于最终模型性能的客观评估。所有标注文件均采用标准YOLO格式,与图像文件一一对应,无需格式转换即可直接调用。
五、数据集核心优势
1. 真实人脸多场景采集
所有数据均来源于真实人脸图像采集,覆盖不同肤色、光照条件、拍摄角度及面部遮挡情况,能够真实反映智能测肤与医美辅助诊断的实际应用环境。具体覆盖维度如下:
- 不同肤色类型(浅色、中等、深色)
- 不同年龄段(青年、中年、老年)
- 不同性别(男性、女性)
- 不同肤质类型(干性、油性、混合性、敏感性)
- 不同拍摄环境(室内自然光、室内灯光、户外)
这些因素的多样性综合起来,能够显著提升模型在实际部署环境中的表现性能。
2. 多尺度瑕疵目标覆盖
面部皮肤瑕疵在图像中呈现出显著的尺度差异——从细微的毛孔级到明显的片状区域,跨度极大。数据集中包含:
- 细微瑕疵(黑头、白头、雀斑等小尺度目标)
- 中等瑕疵(痘疤、丘疹、色斑等中尺度目标)
- 显著瑕疵(红肿、炎症、眼袋等大尺度目标)
- 孤立瑕疵与密集瑕疵集群
这种设计能够有效提升模型对不同尺度瑕疵目标的检测能力,避免“小目标漏检、大目标误检”等常见问题。
3. 丰富的皮肤问题类型覆盖
数据覆盖三大类皮肤问题:
- 色素沉着类:雀斑、晒斑、黄褐斑、黑眼圈等
- 炎症反应类:红肿、血管扩张、丘疹、脓疱、结节等
- 结构老化类:皱纹、眼袋、疤痕等
类别覆盖面广,能够有效增强模型在多种皮肤问题复合场景中的鲁棒性与泛化能力。
4. 高质量专业标注
所有图像均由经过专业培训的标注人员进行精细化标注,并经过多轮审核校验,确保不同瑕疵边界的精确性;覆盖细微与显著瑕疵的精准定位;边界框紧密贴合瑕疵区域;无漏标;无类别混淆。这些细节直接决定了模型训练的初始质量。
5. 强泛化能力
数据集涵盖了不同面部特征与面部朝向、不同表情状态、不同面部遮挡(如眼镜、刘海、口罩)、不同光照条件及拍摄距离。这些多样性能够大幅提升模型在实际皮肤分析任务中的泛化能力——换言之,模型在实验室环境下表现优秀仅是起点,在用户手机前置摄像头拍出的真实场景中依然保持稳定,才是真正的考验。
六、适用场景
智能美妆APP/AI测肤
为用户提供个性化的皮肤问题诊断报告、肤质评估及定制化护肤建议。
医美辅助诊断系统
辅助医生对面部瑕疵进行定位、面积估算及严重程度分级,有效提升诊疗效率。
护肤品效果验证
量化评估护肤品使用前后皮肤瑕疵面积与数量的变化,为护肤效果提供客观数据支撑。
皮肤健康管理平台
作为皮肤健康管理系统的核心视觉感知模块,支持日常肤质跟踪与问题预警。
面部识别预处理
在人脸识别前去除皮肤瑕疵干扰,提升人脸识别系统的准确率与鲁棒性。
皮肤科人工智能研究
为皮肤科人工智能研究提供高质量标注数据,推动计算机辅助诊断技术的进步与发展。

七、适用研究方向
从研究角度看,本数据集可应用于多个方向:面部皮肤瑕疵检测、多尺度目标检测、细粒度目标检测与分类、医学图像目标检测、智能美妆与肤质分析算法、YOLO系列模型优化、轻量化检测模型、数据不平衡与标签噪声处理、域适应与跨数据集泛化、面部图像分析、计算机辅助诊断、护肤品功效量化评估等。无论是工程落地还是学术研究,都能从中找到合适的切入点。
八、总结
人脸多类型皮肤瑕疵智能检测数据集(Facial Skin Defect)包含3000张高分辨率标注图像,采用标准YOLO格式构建,专注于面部皮肤瑕疵的智能识别与定位。数据集覆盖黑眼圈/眼袋、痤疮疤痕、黑头、色斑/晒斑、炎症/红肿、丘疹/脓疱、白头粉刺、皱纹等8类核心皮肤问题,具备瑕疵尺度跨度大、肤色与场景多样性高、专业标注精准等特点,可广泛应用于智能美妆、医美辅助诊断、皮肤健康管理、护肤品效果验证等场景,是开展面部皮肤分析算法研发与智慧美妆系统建设的优质数据资源。
