最近,关于人工智能会不会抢走人类饭碗的讨论,可以说是越来越热了。大家心里都犯嘀咕:我的工作到底安不安全?为了回答这个问题,学术界和业界都在尝试量化评估,给不同职业打一个“被AI取代的风险分”。
这个思路很直观:拆解一个职业具体要干哪些活儿,再看看这些活儿里,有多少是AI能干得更快更好的。比如,面包师的核心任务包括揉面、烘烤;金融分析师则需要评估企业财务状况。如果一个职业里的大部分任务都能被AI高效替代,那它的“风险暴露评分”自然就高。

这是2025年1月8日在美国拉斯维加斯消费电子展Old World Labs展区拍摄的机器人展示。新华社发(曾慧摄)
道理虽然简单,但实际操作起来,却遇到了不小的麻烦。目前主流的评估方法大致有三种,可每种都有明显的短板。
第一种是靠专家人为打分,主观性太强,不同专家的判断可能天差地别。第二种是看员工实际使用AI工具的情况,但这往往局限于某个特定平台的数据,代表性不足,难以反映全貌。至于第三种,也就是直接用AI模型来评估,听起来很“以子之矛攻子之盾”,但问题同样不少。
AI自己都“吵”起来了
美国全国经济研究所4月份发布的一项研究,就生动地揭示了这个问题。研究人员向当时几个主流的大模型——ChatGPT-5、“双子座2.5”和“克劳德4.5”——提出了同一个问题:哪些职业被AI取代的风险更高?
结果很有意思,这几个“裁判”给出的答案并不一致。比如对于会计师、广告经理甚至首席执行官这类职业的风险评分,几个模型经常各执一词。虽然ChatGPT和“双子座”的意见相对接近,但即便如此,它们也有大约四分之一的时候看法相左。
为什么会出现这种分歧?研究人员分析,原因可能来自两方面。首先是模型本身的差异,不同的训练数据、算法架构会导致它们对世界的认知和判断标准不同。其次,也和职业本身与AI的“亲密度”有关。一个典型的例子是金融分析师,这个行业很早就开始大规模应用AI工具进行分析预测,而这些应用产生的数据,反过来又成了训练新一代AI的“养料”。这种复杂的互动关系,很可能影响了AI模型对该职业风险的判断。
结论与启示
所以,这项研究给我们提了个醒:想靠单一AI模型来精准预测职业风险,目前看来还不太靠谱。面对这种不确定性,更审慎的做法是综合参考多个模型的评估结果,交叉验证。
更重要的是,我们不能只停留在问AI“你怎么看”,而应该深入调查人工智能在各个行业到底是如何落地的,具体在执行哪些任务。只有掌握了这些一线的、具体的应用数据,我们才有可能生成更客观、更可靠的“风险暴露评分”,从而更好地理解这场技术变革对就业市场的真实影响。
