非常感谢社区用户们一直以来的信息支持与贡献。2026年1月20日,智谱正式发布并开源了新一代混合思考模型——GLM-4.7-Flash。该模型总参数量达到300亿,激活参数量为30亿,在同规模模型中实现了性能与效率的出色平衡,旨在为轻量化部署场景提供更具优势的解决方案。
即日起,GLM-4.7-Flash已在智谱开放平台上线,并取代此前的GLM-4.5-Flash模型,面向用户免费开放调用。在多项主流基准测试中,包括SWE-bench+Verified和τ²-Bench,该模型表现优异,性能超过了gpt-oss-20b以及Qwen3-30B-A3B-Thinking-2507,在相近参数级别中达到了当前开源模型里的领先水平。
在内部编程任务实测中,GLM-4.7-Flash于前后端开发相关场景下均展现出优越的能力。此外,我们建议用户可在中文内容创作、文本翻译、长文本处理,以及情感交互、角色扮演等通用应用场景中广泛使用该模型,从而充分体验其能力提升带来的效果。
需要特别提醒的是,上一版本的免费模型GLM-4.5-Flash将于2026年1月30日正式下线,用户应尽快完成模型调用接口的版本更新。系统会在GLM-4.5-Flash下线后,自动将原有请求切换至GLM-4.7-Flash,以确保服务的连续与稳定。
GLM-4.7-Flash的源代码现已在相关社区平台开放,供研究人员与开发人员下载使用。
