游乐游手机版
首页/AI热点日报/热点详情

揭秘你不知道的人工智能背后AI训练师真相

类型:热点整理2026-07-01
先来看一组数据:根据IDC的统计,全球每年产生的数据量将从2016年的16 1ZB急剧攀升至2025年的163ZB。这绝对是一个不容小觑的规模。 “抬头是山,低头是煤。”在山西传统煤矿干了8年的郭梅,过去每天的工作就是守在电脑屏幕前,监测矿井瓦斯浓度。她从未想过,自己的职业生涯有朝一日会与人工智能紧

先来看一组数据:根据IDC的统计,全球每年产生的数据量将从2016年的16.1ZB急剧攀升至2025年的163ZB。这绝对是一个不容小觑的规模。

你不知道的人工智能背后的AI训练师

“抬头是山,低头是煤。”在山西传统煤矿干了8年的郭梅,过去每天的工作就是守在电脑屏幕前,监测矿井瓦斯浓度。她从未想过,自己的职业生涯有朝一日会与人工智能紧密相连。

两年前,为了让孩子在太原上学,郭梅搬到了市区,找到了一份数据标注的工作。同样是盯着屏幕,但内容完全不同:她需要为图片、文本或声音打上标签,再交给机器学习。从一开始每天只能标注两三百张,到如今日均完成1300多张,按件计酬的收入也稳步攀升,已经超过当地平均工资水平。

行业里有句话:有多少智能,背后就有多少人工。像郭梅这样的AI数据标注师,正是伴随人工智能浪潮而涌现的新职业。2020年2月,“人工智能训练师”正式被列入国家职业分类目录。

他们被称为人工智能背后的无名英雄。核心工作只有两项:数据采集和数据标注。简单来说,就是教会AI认识数据,并将其转化为机器能够消化吸收的“语言”。

这项工作听起来简单枯燥,但意义却十分重大。“就像汽车没有燃料就无法行驶一样,数据是AI发展的核心燃料。有了我们的标注作为基础,算法不断迭代,AI才能持续进步。”山西麟诺公司的总经理李应维如是说。

“从未想过能与AI结缘”

二十出头的李宇龙,从未亲眼见过真正的无人驾驶汽车,但他的工作却与自动驾驶算法密不可分。

以前他在电子厂打工,转行做AI数据标注后,老板交给他的第一个任务就是“车道线打点”。

怎么理解呢?无人车在路上行驶时,会连续拍摄照片。李宇龙需要做的就是给这些照片上的车道线做标注——区分虚线还是实线,匹配对应的属性,告诉AI:虚线可以变道,实线不行。最难的是交会和分岔路段的标注。

他把自己比作“幼教老师”。就像拿着一个红苹果教机器识别,结果换一个绿苹果过来,机器就懵了。他工作的意义就在于,不断帮助机器识别不同颜色、大小,甚至被咬了一口或有瑕疵的苹果,直到随便拿出一个苹果,机器都能准确辨认。

李宇龙介绍,数据标注按件计酬,他日均收入在300元左右。2019年太原城镇居民人均可支配收入是36362元,他的收入在整个基地属于中等水平,“有些人一天能突破千元”。

刚开始做这行,他只当是一份重复性工作。后来项目越做越多,涉及教育、安防、金融、交通医疗、电商等领域……每天都在挑战学习能力,他也开始琢磨自己标注的数据到底用在什么地方。虽然还没坐过无人车,但现在看到自动驾驶的新闻,他会想:这里面也有我的标注成果。

像李宇龙、郭梅这样的数据标注师,在每一间办公室里,场景都大同小异:一排排屏幕前,年轻人对着文本、图片、语音和视频进行标记、标重点、打标签、框对象。他们可能正在为无人车标注车道线、红绿灯,也可能在为肺部影像标注病毒数据。

是不是“AI富士康”?

数据标注产业带动的就业规模不容忽视。在河南、河北、贵州等地,甚至出现了“数据标注村”。

据IDC统计,全球每年产生的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%是非结构化数据。这些数据只有经过清洗和标注才能释放价值。仅在国内,每年需要标注的语音数据就超过200万小时,图片更是以亿计。李应维预计,明年他们公司用工量将翻一倍,从160多人扩大到300人左右。

李应维公司所在的百度(山西)人工智能基础数据产业基地,已经是国内人员规模和产值最大的单体数据标注基地。这里AI数据标注师超过2000人,营业收入过亿,入驻企业35家。基地计划未来5年培养5万名AI数据标注师,引入更多AI合作伙伴。

但换个角度看,数据标注师似乎是AI领域门槛最低的工种:技术门槛不高,招工范围宽泛。每天几千次重复动作,却在和最前沿的科技产生联系。也因此,有人给它贴上了“AI富士康”的标签。

数据标注带来了技术红利,可如果AI发展到一定程度,会不会反过来取代数据标注师?

艾瑞咨询的报告指出,随着算法需求越来越旺盛,单纯依赖人工标注已经跟不上市场需求。增强处理平台的持续学习能力,由机器不断学习人工标注,提升预标注和自动标注对人工的替代率,将成为趋势。与此同时,AI对数据质量要求越来越高,行业正逐步走向精细化。

百度(山西)人工智能基础数据产业基地负责人尉赤认为,数据标注是一个很好的入门机会。进来之后可以更深度地参与到产业链协作中。后续随着标注工作越来越机器化,人工和自动化之间需要有机协同,这对员工的要求自然更高。

而且,当数据标注越来越靠机器完成时,人工智能训练师就有了转岗的可能。标注员们现在标注数据,未来可以向数据治理、数据解决方案设计和项目管理等方向转型。

来源:https://m.elecfans.com/article/1269947.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。