
几个月前,当“宝妈”李欣欣(化名)在春晚舞台上看到机器人表演武术时,她或许未曾料到,这股由资本推动的“具身智能”浪潮,竟会如此迅速地渗透到她所在的五线城市,而她自己也成为了这股浪潮中的一名参与者。
如今,她担任“具身智能居家数据采集员”这份新兴职业已有一个多月。每天,她都会投入数小时,完成一项特别的任务:通过录制视频,教会机器人如何完成家务。
拍摄视频,成为机器人的“家务教练”
春节前后,李欣欣在社区微信群中发现一则招聘启事:招聘居家数据采集兼职,强调“无需坐班,在家即可工作”。这对于需要照顾两个年幼孩子的她而言,无疑具有巨大的吸引力。她迅速提交了申请。
正式入职前,她首先完成了“试采”任务:用手机在家中拍摄自己徒手折叠纸巾、打包垃圾袋的短视频。随后,她前往公司学习核心设备——数据采集夹爪的使用方法。这款设备是无本体数据采集的关键,能够精准记录操作时的手部运动轨迹和力度状态。
领取设备后,李欣欣次日便在家中开始了工作。她通常将工作时间安排在孩子入睡后,每日约4至5小时。以5月12日为例,前一天她在线上任务系统领取了“从杂乱桌面环境中识别并抓取布袋、积木等物品”的任务包。为此,她需要特意在桌面上布置出凌乱的场景,然后佩戴夹爪进行数据采集。
“对于简单的任务,一段有效视频数据大约只需20到30秒。”李欣欣介绍道,她每天会完成公司规定的至少1.5小时有效采集时长。

除了兼职人员,也有全职投身于此的数据采集员,且工作场景不仅限于家庭。王亚楠便是一名专职数据采集员。几年前他曾从事外卖配送,后来转行做自动驾驶数据采集。去年下半年,其公司开始拓展具身智能数据采集业务,他第一时间报名加入。
“相比采集车辆数据,现在的工作内容更加多样。”近一年来,他采集过家居、酒店乃至公园等多种场景的数据,主要涉及两种模式:UMI(穿戴夹爪设备采集)和Ego视频(用简易支架固定手机拍摄徒手动作)。

通过这份工作,王亚楠“体验”了各种家务劳动。在公司租用的模拟家居房间内,他需要佩戴设备,录制自己叠衣服、擦桌子或制作三明治的过程视频。他总结了几点关键要求:动作速度和流程需合理、自然;视频画面中只能出现自己的双手,不能有其他人影。所有这些规范都是为了确保采集数据的“纯净度”,便于机器人后续进行高效学习。这些视频上传后,会有专人处理动作轨迹、力度等关键信息,最终用于训练机器人模型。
王亚楠的采集效率在团队中名列前茅。在家居场景下,他一天能采集超过200条视频,有效时长约2到3小时。他打趣说:“平时经常做家务的人可能上手更快,看到任务描述就能立刻明白该如何动作。”
“数据采集入门容易,但极其考验耐心”
目前,这个新兴岗位的从业者多以“宝妈”和应届大学毕业生为主。与多家具身智能企业合作的龙誉大数据公司总经理何宁透露,自去年底相关业务受到市场关注以来,公司项目接连不断,一直在持续招聘数据采集员。他们以UMI设备采集为主,对采集员设有高中以上学历、年龄在18-40岁之间的基本要求。目前公司约百人的采集员团队中,“宝妈”群体的占比接近60%。
这份工作的薪酬待遇如何?相关招聘信息显示,居家数据采集员的月薪多在3000-4000元区间,日薪约百元,时薪约25元。李欣欣对这份兼职比较满意,既能兼顾家庭,也能获得每月约3000元的收入,实现了个人价值。在王亚楠看来,在四线城市,每月6000-7000元的专职收入也算不错,当然在任务量少或复杂度高时,月薪可能降至5000元左右。
然而,受访的采集员们都提到,工作虽然上手门槛不高,却极其需要细心和耐心。李欣欣表示,光是布置操作环境、寻找和更换道具就要耗费大量时间,有时工作5小时,最终的有效采集时长可能只有1.5小时。王亚楠则指出,工作具有重复性,同一个动作可能需要在床铺、沙发、洗衣机旁等不同场景下反复采集多次,以满足客户的多样化需求。

值得注意的是,这类兼职工作的收入稳定性可能存在不确定性。有记者曾通过社交平台联系上一个Ego视频采集兼职团队,在按要求拍摄洗碗、叠衣服视频并提交审核后,却收到“后台系统崩溃,暂停上传”的通知,最终未能获得报酬。有行业人士分析,国内Ego视频采集尚处于探索初期,系统稳定性有待完善。何宁也提醒求职者,需谨慎辨别由个人组织的采集招募,尤其是那些要求预先缴纳押金的情况。
数据采集岗位正下沉至三四线城市
居家数据采集员这一职业的出现,与具身智能行业的迅猛发展息息相关。随着多家科技企业加速机器人商业化落地,行业对高质量训练数据的需求激增。在成本较高的真机遥操作采集模式之外,成本相对较低的无本体数据采集模式正受到越来越多企业的青睐。
目前,国内已有多家企业布局无本体数据采集业务。从招聘信息来看,数据采集员的工作地点有的设在企业自建的专业训练场,有的则需要前往指定的酒店、商超等真实场景。招聘方包括具身智能机器人公司、专业的数据服务公司以及第三方人力资源公司。
行业头部公司的规划揭示了这一趋势的潜在规模。智元机器人合伙人此前曾表示,在其2026年计划的千万小时数据产能中,无本体数据的占比将达到60%-70%。其相关业务正采取“自营+加盟”的轻资产模式运营,未来还可能引入众包机制。
博阅科技负责人王会军认为,具身智能数据采集很可能重演自动驾驶数据采集的发展路径:考虑到人力与场地成本,相关岗位将逐渐向三四线城市下沉。这一点,从多家企业将数据标注与采集基地布局在宿迁、自贡、赣州、柳州等城市便可见一斑。
当前,市场对数据采集员的需求正在持续上升。何宁坦言,由于当地人口结构等因素,招聘年轻员工并不容易,而“宝妈”们兼职时间较为零散,导致团队产能存在较大缺口,面临一定的交付压力。他计划调整人员结构,并抓住校园招聘的时机补充人力。按其现有项目订单估算,团队规模或许需要扩张至千人左右才算比较理想。

对于未来,数据采集员们也有自己的规划。王亚楠希望积累更多经验,未来能够晋升为项目经理,直接对接客户需求,甚至了解机器人研发的最新进展。虽然他尚未亲眼见过自己“训练”的机器人,但他坚信,自己采集的这些视频数据,正在一点一滴地教会机器人如何更智能地“干活”。
那么,当机器人真的通过海量数据学会所有家务的那一天,这些曾经的“人类教练”们又将何去何从?李欣欣说,她还没有想那么远。
