2026年6月1日,马斯克的AI公司xAI悄然在官网挂出一则招聘公告——全球范围内招募中文AI训练师。目标很明确:给自家旗舰大模型Grok的语音互动和多语言处理能力来一次全面升级。这一动作,其实释放了一个信号:xAI在多模态语音赛道上,正在加速布局。

招聘信息显示,这个岗位给出的时薪是35到45美元(大概软妹币237到304元),而且工作模式相当灵活——全职、兼职、合同制远程办公都行,平均每周只要求至少投入10小时。和过去那种单纯的文本标注不同,这次招募的核心任务直接指向大模型的多语言音频深层训练。
具体做些什么?语音标注、录音、转写、评估口音和语调,这些专业维度都是日常工作。要求也很清楚:候选人必须是中文母语水平,对不同口音、方言或者地区变体得心中有数;同时英语要达到B2水平,能自然流畅地录制英文音频。如果你有语言学、语音学、配音或者音频数据标注的背景,那就更对胃口了。
放眼当下,全球大模型的竞争早就从单纯的文本理解,演进到了语音、图像等多模态实时交互的阶段。xAI这次重金招募中文音频专家,说到底不只是为了消除Grok在中文多语境下的口音和语调障碍——更是想在和OpenAI、Anthropic这些头部玩家的全球化多模态竞争中,给自己建一道更深的技术护城河。可以预见,这会显著加快Grok在端侧语音交互以及跨文化应用场景里的落地速度。
