AI 工程师:一个全新的角色,不是机器学习工程师的“换皮”
你是否也曾困惑:AI 工程师和机器学习工程师到底有什么区别?为什么自己搭建的智能体在演示时惊艳全场,一放到真实用户面前就问题百出?真正的 AI 工程,核心不是搭建智能体,而是永不停歇的“构建-评估-改进”循环。本文将从核心概念、必备技能、工作闭环到常见误区,为你全面解析这个新兴的角色。
一、AI 工程师 vs 机器学习工程师:一个在应用层,一个在模型层
很多从传统开发或机器学习方向转型的工程师,都会问这个问题。简单来说:
- 机器学习工程师:扎根在模型层——训练模型、采集和管理数据集、优化模型性能。他们研究科学原理、设计模型架构、搭建训练流程,与研究工程师一起撰写论文,为领域奠定基石。
- AI 工程师:活跃在应用层——拿过这些模型和研究成果,将它们变成真正服务于用户的产品。你可能需要啃数学论文,实现新颖且高性能的智能体架构,但你的产出是一个能跑的产品,而不是一个训练好的模型。
小提示:如果你喜欢把研究成果落地成产品,并且享受解决实际用户问题,AI 工程可能更适合你;如果你更喜欢钻研模型内部原理和训练过程,机器学习工程方向更对口。
二、AI 工程师的四项核心技能与日常具体工作
根据 LinkedIn 上 AI 工程师的招聘要求,有四项技能反复出现:RAG(检索增强生成)、评估体系(Evals)、智能体(Agents)、生产部署。其中前三项可以作为系统课程学习,生产部署则与团队和环境高度相关。
在这些标题技能之下,是日复一日的具体工作,这才是这门学科的内核:
- 上下文工程:在正确的时机,把正确的 token 送给模型。Token 就是货币,与能耗成本直接挂钩。我们正在走向以“每瓦 token 数”作为度量单位的未来。
- 工具设计:赋予智能体恰当的能力,确保它们能做该做的事,又不会做不该做的事。
- 评估:度量智能体的表现,判断它们是真正在进步,还是我们只是自我感觉良好。
- 生产可靠性:包含自愈能力、用户体验、用户如何感知系统故障、错误处理和延迟应对。这些东西决定了系统在接触现实后能否存活。
常见问题:我搭建的智能体,一到真实用户面前就崩了,为什么?
答案:因为演示走的是理想路径,而真实用户会输入各种意想不到的提示词(比如往提示词里塞三只蚂蚁)。AI 本质上是一个预测器,不是真正的智能。你需要通过评估-改进循环,逐步提高系统的可靠性和鲁棒性。具体做法是:先收集真实用户失败的案例,分析失败原因,然后设计针对性的评估指标,再通过提示工程、工具设计或架构调整来修复。
三、构建 → 评估 → 改进:永远循环,没有“上线收工”
搭建一个智能体很简单(用现有的 SDK 五行代码就能搞定)。真正重要的是之后的一切:评估它哪里不行,搞清楚为什么不行,针对那个具体的失败点施以正确的技术手段去修复,然后再评估一轮。
这个过程永远不会停。这份工作永远不会有“做完了”的那一天。这就是一个非确定性系统想要做到可靠所必须配备的角色。没有“上线收工”这回事,有的只是这个循环:
构建 → 评估 → 改进 → 评估 → 改进 → ……
四、为什么 AI 工程会演变成一整支团队?
看看 OpenAI 的招聘启事就知道了:他们不是在笼统地招 AI 工程师,而是为系统中某一个具体切面招人。一个团队负责工具选择,一个团队负责人机协同,一个团队负责安全,还有一个团队专门想办法在不损失准确率的前提下压缩 token 用量。
ChatGPT 在很多方面依然表现不佳,而这已经是有整支团队专注于各个子系统的结果了。当你的产品本身就是一个智能体时,所需投入的精力就是这个量级。这不是全栈工程师顺手兼顾一下的事,这是一门独立的学科。
常见问题:AI 工程师需要会训练模型吗?
答案:通常不需要。AI 工程师的工作是基于已有的模型(如 GPT、Claude 等)构建应用。你不需要自己训练模型,但需要深入理解模型的优缺点,知道如何通过上下文工程、工具设计、评估循环来提升模型在具体场景下的表现。当然,如果你能理解一些模型原理,对设计更好的提示和架构会更有帮助。
五、最难的不是代码,而是选对度量指标
这份工作最难的部分,在于搞清楚该用哪些数据来做评估、该对标哪些指标来打分。什么样的指标最合适,能给出最有效的信号?我们该怎么打分?随着系统越来越可靠,我们又该如何迭代这套评分体系?
这里面有大量的科学、艺术,以及一些说不清道不明的东西。但它是一切的根基。选错了指标,你的循环就是在原地空转;选对了指标,整个系统就能形成复利效应。
这就是为什么这个角色自成一体。软件工程师优化的是确定性的代码路径,机器学习工程师优化的是模型,而 AI 工程师优化的是架构在非确定性系统之上的反馈循环——而最大的杠杆,来自于选择衡量什么。
结语:一个实践领域,而非一个流行词
AI 工程不是营销包装出来的新概念,而是当你不再只是做演示、真正开始交付产品时,工作本来的面貌。它处于与机器学习不同的层次,需要与传统应用开发不同的思维方式,遵循不同的循环,关注不同的指标,并且正日益成长为一条独立的职业路径。
如果你是一名开发者,正在犹豫要不要投身这个方向,记住这句话:智能体是简单的部分,循环才是真正的工作。
关于本文
译者:@飘飘
作者:@Scott Moss
原文:https://frontendmasters.com/blog/ai-engineer-is-a-new-role/
