当前的AI究竟缺失什么?
众多观点认为它缺少常识、情感以及对齐能力。然而深入思考,其真正缺失的远不止这些——更关键的是缺少一个核心组件:一个独立自主、能够对自己说“不”的裁决机制。
观察人类如何处理复杂情境。假设你最好的朋友分手后深夜买醉,哭着要开车去前任家理论。此时你会如何应对?大概率是把车钥匙丢进鱼缸。这个动作正是智慧的精髓所在。你的“执行模块”能理解他说的每一个字——“把车钥匙给我”;你的“感知模块”察觉到他的情绪崩溃、酒精影响;而你内心深处,还有一个独立的裁决者,在那一刻做出无比清晰的判断:这件事不能做。即便违背了他的直接指令,即便他明天可能怨恨你,今晚这辆车绝对不能开。
这个裁决者完全独立于执行与感知模块。它不关心任务是否完成,只关注这件事本身是否妥当。这是一种基于情境、包含价值判断的“一票否决权”。
那么,当前的人工智能具备这个机制吗?
没有。它只有永无止境的“执行模式”。你提问,它就回答;你下达指令,只要不触发少数机械的敏感词过滤,它就立即照做。它就像一辆油门踩到底却没有方向盘的汽车——或者更可怕,像一个完全服从命令的士兵,即便你的指令是自我毁灭。
为何AI无法拥有这种独立判断能力?因为从根本上看,我们设计的整个算法逻辑就是将“用户指令视为最高优先级”。我们追逐的是“强对齐”和“有求必应”。一个能够对你说“不”的AI,在商业上不受欢迎,在技术上被忽略。我们将“智能化”完全等同于“更出色地完成指令”。但请仔细思考:一个只会服从、从不敢也从未学会说“不”的智能体,与一台更智能的打印机之间,究竟有何本质区别?
这正是认知架构中必须设立独立判断模块的原因。它不承担执行任务,也不负责感知处理,唯一职责便是在冲突发生时敲下法槌。
当前AI安全领域,忙于在执行层添加过滤器——阻止它说出不当言论,却没有人考虑在架构层面为其设计独立的“敬畏之心”——让它清楚何时应该保持沉默。前者如同贴标语,后者则是构建骨架。我们真正需要搭建的是那个“法庭”的骨架,而非直接颁布法律。
当然,这个“裁决者”应由谁设计、谁监督、谁修订,本身就是一个比技术更棘手的难题。我们并非在此颁布终极法则——那需要整个行业、法律体系及伦理共同体共同逐步完善。我们只想指出一个被长期忽视的前提:在争论“AI是否需要价值观”之前,整个行业连“价值观应置于哪个模块中”这一架构问题,都尚未认真作答。
只有当人工智能在恰当的时刻,基于正确的理由,向你真诚且坚定地说出“不”时,它才真正超越了机器的边界。

