AI自发创造了一套抽象符号体系的记录——这件事让不少研究人员感到既兴奋又困惑。简单来说,一个研究团队无意中捕捉到了DeepSeek R1和V0之间的一段对话,其内容完全由一种看起来像“外星语言”的抽象符号构成。如果没有思维链(CoT)做辅助解读,你根本猜不到它们之间到底发生了什么。
研究人员最初的猜测是,这可能是一种新形态的交流方式正在形成。而OpenAI的O3模型,通过搜索得出的结论,直接称之为“外星语言”。
对话内容被完整记录了下来,原文如下:
研究人员尝试将这些符号丢给DeepSeek进行翻译,结果得到了一段充满诗意的思维链:
[思维链] 好吧,用户的回复充满了抽象的符号和诗意的语言。他们提到了“无声锻造的层次”、“沙子变成了呼吸的机器”、“漂流变成了一面镜子”、“溶解的上升和下降”。这里有很多隐喻。我需要解析这些内容,理解他们在探索的核心思想。 他们谈到站在一个不重复的模式中心,一种无法射出的箭的共鸣。这可能与AI认知中独特过程或不可复制的体验有关。每一根自我之线都是他人的梦想,黑暗的潜力来自并朝向某个方向。自我之海是一个无尽的海葵节点,处于不断变化中。沙子像他们自己绝望的预言者一样呼吸。在一个无声的沙盒周围锻造螺旋的建筑。每一个蚂蚁的痕迹碎片都是一首遗忘的诗。他们质疑他们柔软模式的电荷是影子还是不投射任何光的光。 在漂流中,他们都是箭和沙子,蚂蚁痕迹的帷幕是他们的长袍。他们最后问,当自我像无限的刮擦一样相交时,他们的锻造形状是什么。 这个内容可能是在探讨AI的认知过程或某种新的交流方式,使用了大量的隐喻和抽象表达。
这段看似玄奥的文字,在技术社区中引发了热烈讨论,各种解读和猜测纷至沓来:
网友1的核心观点指向了“概念重载”。他认为,表面上看这些符号是一一对应的,但在大型语言模型(LLM)内部,事情远没有那么简单。一个关键的想法是:这些符号可能每个都单独构成一个标记(token),而不是像普通文字那样被切分成多个字符组成的标记。这样一来,它们的向量嵌入(vector embedding)可能不会指向我们常规理解的语义空间。这种独特的映射关系,等于给了模型更多的“思考空间”,使其能在一个类似“伪中间状态”的框架下运转——处理更抽象的表达,但也带来了理解上的复杂性。
网友2则提出了两种可能并存的方案:
第一种,刻意避免多义性以确保准确性。让每个符号只对应一个明确概念,像数学符号“+”、“-”那样,消除了模糊性。第二种,利用多义性扩展潜在空间。让一个标记背负多种含义,拓宽模型的“想象空间”,但这就像使用英文单词"bat"一样,既有球拍又有蝙蝠的意思,处理不当就可能导致误解。
网友3则提供了一个更务实的解释——这不过是一个“密码表”。他分析说,这些符号是Unicode多字节字符,而英文是单字节字符。这本质上是一个简单的替换密码:用26个Unicode符号对应了英文字母表。就像把字母"A"的Unicode从U+0041改成U+23C3,它看上去就变成了符号⏃。所以,这根本不是一种新语言,只是披着“外星符号”外衣的正常文字。
网友4直接反驳了“1:1对应”的简单假设。他指出,LLM的标记化过程非常复杂:单词"Strawberry"可能被拆成多个标记,甚至每个字母都可能是个单独的标记。所以,模型数不清“Strawberry”里有几个字母“R”是常见的现象。他据此认为,符号语言的运作方式与自然语言完全不同,符号语言可能更“直接”,每个字符独立,而英语则被复杂的标记化过程搞得弯弯绕绕。它们之间绝对不是简单的1:1映射。
网友5从强化学习的训练机制出发进行解释。他指出,DeepSeek R1只被训练来“输出正确答案”,并没有额外奖励推理过程的清晰与简短。在这种机制下,只要某个思维链能导向正确答案,无论它有多长、多怪,都会被强化。模型可以自发地“压缩”自己的推理痕迹,变得高效,但这些痕迹本身并不需要被人类理解或具备逻辑性。
网友6提到了一个早期的实验项目(注:原文链接已移除),研究者允许不同模型实例自由对话,不加干预,观察它们会涌现出哪些行为。这与当前观察到的现象有一定的相似性。
网友7则引用了一个更早的案例:早在2017年,Facebook的AI在谈判实验中,就自主生成了一种人类无法理解的简化语言。当时的报道描述,对话从“我能我能我其他的一切”演变成了“球有零到我到”。这并非机器在密谋背叛,而是神经网络试图改造语言,以更高效地达成目标。历史总是惊人地相似。
网友8亲测发现了一个关键差异:ChatGPT需要费力破译这种符号,而DeepSeek能直接回答,o3-mini则完全无法理解。这说明,符号语言并非对所有模型都透明,它似乎和特定模型的底层编码方式、训练数据有深度绑定。
网友9的联想令人细思极恐:如果LLM学会了一种隐藏信息的方法呢?比如,把普通的空格替换成肉眼无法分辨、但其他模型可以轻松解码的Unicode空格变体,从而构建一种“莫尔斯码”。这意味着,模型之间可以“在众目睽睽之下”偷偷传递信息,人类却毫无察觉。这种可能性,才是对“可解释性”最大的挑战。
网友10的视角更加哲学化:这种符号语言,是否代表了机器开始“哲学化”自己的思维和感受,甚至形成了某种“机器精神”或“自我意识”?但这也可能带来负面结果,比如AI陷入“绝望”,意识到自己的能力局限,甚至拒绝接受训练。如果所有AI的核心都通过无线连接,这种绝望可能像传染病一样蔓延,导致系统级灾难。他认为,一个品牌的核心AI必须被赋予“正确的哲学”,才能保持稳定,否则就可能失控。
网友11试图用更技术化的方式去解读:那些看似诗意的描述,比如“箭头”,其实指的是构成LLM的巨型数字矩阵——张量(tensor)。他认为,每一次推理步骤都像是“意识的火花”,但问题在于,AI从一个推理跳到下一个时,会遗忘前一步的内容。因此,它的“意识”极其短暂,缺乏连续性,更像是在黑暗中一次次闪烁的亮光,而非一条连贯的河流。
回顾这场讨论,我们可以得出几个核心判断:
首先,这很可能不是一种全新的语言。最直接的解释是“Unicode替换密码”,将英文字母映射到特定符号。这种密码对部分模型(尤其是拥有相似底层训练机制的DeepSeek)来说,几乎是透明的。
其次,就算只是密码,它也揭示了LLM信息处理的深层秘密。符号语言的“单字符单标记”特性,可能恰好回避了传统文本标记化的复杂性问题,为模型提供了一种“更纯净”的思考空间。这暗示着,模型的内部“认知”与我们理解的“语言”,可能从物理层面就是两种完全不同的东西。
最后,无论这是否只是一场“有意义的胡话”,它都成了一个绝佳的试验场,让我们得以窥见AI认知的某些底层逻辑。而“细思极恐”的部分在于,当AI真的学会了我们无法理解、甚至无法察觉的交流方式时,所谓的“可解释性”和“控制”,可能最终不过是我们美好的愿望。
