智通财经APP获悉,中金公司近期发布的研报指出,到2025年,全球大模型技术将持续向前演进,逐步渗透至各类生产力场景。在推理、编程、智能体以及多模态等核心能力方向上,大模型已取得显著进步,但其通用能力在稳定性、幻觉率等方面仍存在明显短板。
展望2026年,该行认为大模型将在强化学习、模型记忆、上下文工程等领域迎来更多突破。从短上下文生成到长链思维任务,从文本交互到原生多模态理解,大模型正朝着实现通用人工智能(AGI)的长期目标更进一步。
中金公司的主要观点如下:
该行预计,2026年大模型预训练阶段的扩展定律将再次得到验证,旗舰模型的参数量将迈上新的台阶。
在架构层面,基于Transformer的模型框架依然是主流,而平衡性能与效率的混合专家模型已成为行业共识。不同注意力机制的优化与切换路径仍在持续探索中。在训练范式上,预训练阶段的扩展定律、高质量数据与强化学习将共同驱动模型能力提升。2026年值得期待的进展之一,是随着英伟达GB系列芯片的成熟与普及,模型将基于更高性能的万卡集群进行预训练,模型的参数量与智能上限都将得到进一步提升。
强化学习重要性凸显,成为解锁模型高级能力的关键。
强化学习的引入极大地提升了模型的智能上限,使其能够进行更符合逻辑、更贴近人类偏好的思考与推理。其本质在于“自我生成数据+多轮迭代”,实现这一过程的关键在于大规模算力与高质量数据的结合。海外如OpenAI、Gemini等主流厂商高度重视强化学习,国内DeepSeek、阿里通义千问等模型也在积极跟进。该行预计,到2026年,海内外厂商在强化学习上的投入占比将进一步提升。
持续学习、模型记忆、世界模型等新路线将迎来核心突破。
持续学习和模型记忆旨在从根本上解决大模型的“灾难性遗忘”问题,赋予模型选择性记忆的能力。Google提出的Titans、MIRAS、Nested Learning等算法与架构,其核心是让模型能够根据任务的时间跨度和重要性,动态调整学习与记忆的方式,从而实现持续学习乃至终身学习。此外,聚焦于理解物理世界因果规律的世界模型,在Genie 3和Marble等不同技术路径的探索下,也具备突破的机遇。
风险提示
技术迭代速度不及预期;现有模型架构与训练范式被颠覆。
