
2026年春节档,人工智能领域迎来了新一波密集的国产大模型发布,引发了行业内外的高度关注。继DeepSeek上周推出新一代模型后,智谱研发的GLM-5与Minimax发布的2.5版本也同步上线,节奏之快让人有些意外。
本轮春节档的重要看点,主要集中在DeepSeek V4、阿里千问Qwen3.5、智谱GLM-5以及Minimax 2.5这几款国产大模型上。而此前已经发布的字节跳动SeeDance 2.0近期同样热度不减,保持着相当活跃的态势。
目前,GLM-5已在z.ai平台正式对外开放。根据最新介绍,该模型定位为新一代旗舰级对话、编程与智能体融合模型。技术路线上,GLM-5延续了DeepSeek-V3及V3.2所采用的稀疏注意力机制(DSA),整体参数量达到7450亿,大概是前代GLM-4.7的两倍左右。此外,模型还引入了多Token预测(MTP)技术,拥有78层隐藏层结构,包含了256个专家模块,每次推理会动态激活其中的8个,对应激活参数量约为440亿,稀疏度为5.9%,上下文支持长度最高可达202K token。
Minimax 2.5版本也已同步发布。值得注意的是,距离其上一版本2.2的推出仅仅过去一个多月,此次更新间隔如此之短,反映出团队在模型迭代效率上的显著提升。
截至2026年2月12日,两家机构尚未完全公布GLM-5与Minimax 2.5的全部技术细节与完整性能指标。不过,可以确定的是,二者都将编程能力和智能体功能作为核心优化方向,旨在提升处理复杂任务的水平,以期对标国际主流模型的表现。实际效果如何,还有待后续更广泛的测试与验证,相关进展将持续跟进。
