本次查询:Data Labeling
中文解释:数据标注
常见场景:模型训练前数据预处理环节 / 常见于计算机视觉 / 自然语言处理 / 语音识别等领域
一句话解释
数据标注是指为图片、文本、语音等原始数据人工或自动添加有意义的标签,赋予机器学习模型理解信息的能力。
为什么会被关注
随着AI落地需求增长,数据标注成为模型性能的关键瓶颈。高质量标注能显著提升准确率,低质量则导致模型“学偏”,因此企业投入大量资源优化标注流程。
核心逻辑
监督学习依赖“输入-标签”对。标注将无结构数据转化为结构化答案,如框出图中物体位置、给句子标出情感极性。标注质量直接影响模型泛化能力,高一致性标注能减少训练噪声。
常见场景
自动驾驶中标注车道线和行人;医疗影像中标记病灶区域;电商平台给商品图片打属性标签;语音助手转写文字并标入口语意图。这些场景均需要大量高质量标注数据来驱动模型训练。
容易混淆的点
数据标注≠数据清洗。清洗是去除异常值,标注是添加元信息。此外,标注与特征工程也不同:特征工程提取算法可用特征,标注则提供标准答案供模型对照学习。
