Working Memory：AI与人类共有的“临时工作台”_AI热词解释_游乐网

Working Memory：AI与人类共有的“临时工作台”

类型：认知科学概念2026-06-01

工作记忆（Working Memory）是一种对信息进行临时存储和处理的认知能力，在AI领域常指大模型在推理时维持上下文的能力。它决定了你能同时记住多少东西，也决定了AI对话是否“前言不搭后语”。

本次查询：Working Memory

中文解释：工作记忆

常见场景：认知心理学与大模型推理优化

一句话解释

Working Memory（工作记忆）就像你大脑里的一个临时工作台，用来暂时存放正在处理的信息。比如你心算“23×7”时，先记住23再记住7，然后同时进行乘法运算——这些数字和中间步骤就存放在工作记忆中。在AI大模型里，工作记忆类似模型生成回答时能参考的最近对话内容，也就是上下文窗口。

为什么会被关注

人类的工作记忆容量有限（通常只能同时记住7±2个信息块），这决定了我们学习效率的上限。而AI大模型的工作记忆（上下文长度）也同样受限于资源，处理超长文档或复杂推理时容易“遗忘”开头内容。近年来，从GPT-4到Claude都不断扩展上下文窗口，工程师们还在探索“记忆增强”方法，试图让模型像人类一样更高效地利用工作记忆。

核心逻辑

工作记忆由中央执行系统、语音环路和视觉空间画板三个子系统组成。中央执行系统负责分配注意力，语音环路处理声音信息，视觉空间画板处理图像信息。在AI中，Transformer模型的自注意力机制扮演了类似中央执行系统的角色——动态决定“当前应该关注哪些历史信息”。但AI的工作记忆受固定长度窗口限制，而人类可以借助策略（如分组、联想）突破容量瓶颈。

常见场景

场景一：你用ChatGPT进行多轮对话时，模型需要记住前面几轮的问题和回答，这就是在调用“工作记忆”。如果话题太长，模型会丢失早期信息，导致回答偏离。场景二：程序员在IDE里使用AI代码补全时，编辑器提供的代码上下文就是AI的临时工作记忆，上下文越长补全越准确。场景三：自动驾驶汽车同时感知多个路况信息（信号灯、行人、障碍物），算法需要融合这些瞬时输入，其工作记忆机制决定了反应速度。

容易混淆的点

常有人把“工作记忆”等同于“短期记忆”，其实短期记忆只负责被动存储，而工作记忆强调“同时操作与存储”。比如你记住一个电话号码（短期记忆），但边记边拨号就需要工作记忆。AI领域也有类似误区：很多人认为模型上下文窗口越大越好，但实际推理时，模型需要从大量信息中筛选关键内容，这和人类工作记忆的“选择性注意”一样重要。

来源：AI 热词解释频道整理

Working Memory 工作记忆上下文窗口大模型推理认知负荷

上一篇Semantic Memory：AI的“常识百科”记忆系统 下一篇Context Engineering 上下文工程

AI 热词解释