你有没有发现,手机输入法在你打字时会悄悄预测你的下一个词?你输入“今天天气真”,它就会弹出“好”。大语言模型(LLM)本质上做着同样的事——只是它预测得异常精准。
不信我们做个实验。给 AI 输入半句话:The sky is,它几乎一定会接上一个词:blue(蓝色)。
问题在于:它真的“理解”天空吗?还是仅仅在推测下一个最可能出现的词?
答案是后者。而认清这个本质,是善用 AI 的第一步。
做一道概率填空题
当模型看到 The sky is,它并没有“思考天空是什么”。它所做的,是在内部快速计算一道概率题:下一个词是 blue 的概率有多高?是 cloudy(多云)呢?还是 falling(塌下来)呢?
计算结果大致如下:
接着,它依据这个概率分布挑选一个词输出。通常概率最高的 blue 会被选中,偶尔也会出现其他结果。
本质就这么简单——没有理解,只有概率运算。除了这个,它什么都不会做。
打个比方:它就像一个读遍了大半个互联网、记忆惊人强大的“接话高手”。你说上半句,它根据“海量文本中这类句子的常见接续方式”,来帮你补全下半句。
AI “脾气”的由来
为什么它看起来如此博学?
因为它接触过天文数量的文本数据,几乎任何话题都能接上几句。这点确实不假。
为什么它会一本正经地胡说八道?
因为它只关心“接得听起来像真的”,完全不顾“是否真实”。一个读起来通顺、可信的错误答案,对它而言就是一个“高概率的优质接续”。所以,别指望它天然具备区分事实与虚构的能力。
为什么同样的问题,每次回答都不一样?
因为它是依据概率“抽签”生成结果,而不是查固定字典。高概率词经常被抽中,低概率词偶尔也会中选。本质上,每一次回答都是一次独立的“随机采样”。
“怎么问”比“问什么”更重要
既然 AI 是顺着你给出的开头往下推测,那你给出的开头直接决定了它的推测方向。还是那半句话。如果你只丢给它The sky is,它可能随意接话,甚至自行创作一篇短文。但如果你把指令说清楚:
比如:Complete the sentence: The sky is
它就会乖乖补全成一个完整句子。看出来了吗?你没有更换模型,只是换了一个“开头方式”,结果就截然不同。这就是“提示工程”(Prompt Engineering)的起点——不是什么神秘咒语,而是给模型一个清晰、有约束的“预测方向”。
因此,你问什么固然重要,但怎么问——才是真正决定结果的关键。
一句话记住
大模型不是知识库,而是概率预测机器。理解了这一点,你便会明白:为什么“怎么问”,比“问什么”更重要。
