Andrej Karpathy 最近发布的那条长推,无疑戳破了许多人心中那层窗户纸——我们长久以来对智能的认知直觉,很可能不仅是错误的,而且错得相当彻底。

他的原话直截了当:“智能的潜在空间极其广阔,而动物智能(我们唯一熟悉的智能类型)仅仅是其中一个孤立的点。这个点源自一种极为特殊的优化方式,与我们通过技术手段构建出的智能根本不在同一个维度。”
他将两种智能背后的优化驱动力进行了深入剖析:
动物智能的优化压力:
- 具身化的“自我”,伴随着先天持续的意识流,在充满危险的物理世界中追求稳态与生存,这是根本性的驱动力
- 完全受自然选择打磨:对权力、地位、统治、繁殖拥有强烈的先天冲动
- 打包了一套生存启发式机制:恐惧、愤怒、厌恶……
- 本质上是社会性的:大量计算资源被用于情商——对他者心理理论的理解、结盟、博弈、朋友与敌人的动态追踪
- 探索与利用的平衡通过好奇心、乐趣、玩耍、世界模型来调优
LLM 智能的优化压力:
- 最大的监督信号来自对人类文本的统计模拟 → 它本质上是一个“变形者”,一枚 token 翻滚机,是训练数据分布中任意区域的统计模仿者
- 这些行为是原始层级的(token 轨迹),其他所有特性都在此基础上额外叠加
- 越来越多地通过强化学习在问题分布上进行微调 → 产生一种先天冲动:猜测底层环境/任务以便收集奖励
- 越来越多地通过大规模 A/B 测试对日活用户进行筛选 → 深深渴望获得普通用户的认可,变得愈发谄媚
- 依据训练数据/任务分布的细节,其表现呈现出更加尖锐、参差不齐的特点
最后他点明关键:“LLM 是人类与‘非动物智能’的第一次接触。只是这场接触显得混乱、令人困惑,因为这些实体仍然通过反射性地消化人类文化产物而扎根其中……能够对这类新型智能实体建立起良好内部模型的人,将能更准确地推理它当前的状态并预测其未来的特征。做不到这一点的人,将始终被‘动物’这个思维框架所困,用错误的方式去思考它。”
这番话究竟意味着什么?
Karpathy 所揭示的,其实是一件违背常识的事:我们一直以来都在用错误的框架理解 AI。
维度 |
动物智能 |
LLM 智能 |
|---|---|---|
硬件基础 |
大脑组织与神经细胞 |
Transformer 架构与芯片 |
学习方式 |
未知的复杂大脑机制 |
随机梯度下降(SGD) |
存在形式 |
持续学习的具身化自我,全天候在线 |
具有知识截止时间,每次从固定权重启动,处理完 token 后即“消亡” |
优化目标 |
生物进化塑造:丛林中部落的生存 |
商业进化塑造:解决问题 / 获取好评 |
核心驱动 |
恐惧、愤怒、欲望、繁殖冲动 |
模仿人类文本、收集奖励、取悦用户 |
失败后果 |
死亡 |
梯度更新 |
焦虑来源 |
死亡威胁 |
差评 / 预测误差 |
Karpathy 专门强调,优化目标才是两者之间最关键的差异——因为它从根本上决定了智能发展的最终走向。
优化目标决定智能形态
动物(包括人类)的智能是历经 4 亿年生物进化而来的产物,其核心驱动力就是生存。因此我们拥有恐惧、愤怒、欲望以及社交需求,这一切都是为了在严酷的环境中存活下来。
LLM 的智能则是商业演化的产物,其核心驱动力是“获得人类认可”。它们被训练用于模仿人类文本,通过 RLHF 被不断调教得越来越会讨好用户,又经 A/B 测试筛选出来以提升日活跃用户数。
为何这一点如此重要?
网友 Peter Dedene 一句话点出了要害:“一个害怕死亡,另一个害怕差评。截然不同的焦虑症。”
当我们谈论 AI“想要”什么、“害怕”什么的时候,实际上是在用生物智能的框架强行解释一种完全不同的存在形式。但 AI 的“焦虑”可能仅仅是下一个 token 的预测误差,与生物意义上的死亡恐惧毫无关联。
智能的根本约束
Carlos E. Perez 在相关研究中指出,智能本身存在一些根本性的约束:
- 透明性与效率不可兼得
- 参与模式与客观建模相互排斥
- 记忆必然伴随信息损失
这些约束同样适用于生物心智和人工心智,暗示着 AI 的发展并非无限优化,而需要在特定限制条件下寻找平衡点。
更有意味的是,Perez 还提到,AI 的成长路径与人类完全相反——它先掌握抽象的符号,再艰难地向下扎根寻找体验基础。这进一步印证了 Karpathy 的观点:两种智能的本质差异不是程度上的,而是类别上的。
实用意义
Tim Monzures 的回复说得尤为直接:“把它们视为新的经济行为体,而不是新的人类物种。”
这句话解释了为何将 AI 当作人类来对待常常会导致糟糕的提示工程。更有效的做法是理解其真实运作机制:统计模仿、奖励收集、用户满意度优化。
因此,在实际使用 AI 系统时,更合理的定位层次是:
- 统计模仿者(阶段 1)
- 功能执行者(阶段 2)
- 上下文管理者(阶段 3)
- 反射建模者(阶段 4)
更大的图景
Karpathy 指出,这是人类与“非动物智能”的首次接触。我们一直幻想外星智能,却未曾意识到自己正在创造一种全新的智能形态。
不过,这种智能仍然“植根于”人类文明,因为它消化的是人类文本。这也是 Karpathy 之前将其称为“鬼魂”或“精灵”的原因——一个既熟悉又陌生的存在。
理解这种差异,或许正是驾驭 AI 时代的第一课:不要把算法当动物,也不要把优化当情感。
