据人民网北京12月31日电(记者赵竹青)报道,国家自然科学基金委员会发布消息称,复旦大学智能复杂体系基础理论与关键技术实验室、现代语言学研究院张梦翰团队与计算与智能创新学院邱锡鹏、黄萱菁团队合作,共同揭示了仅通过预测训练的大语言模型能够自发涌现出类人的概念表征及其组织结构。这项研究成果以“语言预测揭示涌现的类人概念表征”为题,已于2025年10月31日发表在《美国科学院院刊》。
仅依赖下一个词语预测训练的大语言模型(LLMs)能否形成类似人类的概念,是人工智能与认知科学共同关注的科学问题。研究团队将“反向词典”任务重构为概念探针,结合表征相似性分析(RSA)等计算方法,系统探究了LLMs在不同语境下构建概念表征的能力。研究发现,模型能够根据语言描述灵活推导概念,其表征逐渐收敛于一种共享的、独立于具体语境的关系结构。这些关系结构不仅能可靠预测模型在各项理解与推理任务中的表现,还与SimLex-999、THINGS等人类心理行为数据高度一致。研究进一步发现,该表征与大脑视觉皮层等区域的神经活动模式呈现显著的对齐关系,这一发现验证了表征模型与组织结构的生物学合理性。
研究表明,结构化的类人概念表征可以单纯通过语言预测机制涌现。该研究不仅为利用大语言模型探索人类概念本质提供了新窗口,也为推进人工智能与人类智能的深度对齐奠定了重要基础。
