
1月8日,北京智谱华章科技股份有限公司(02513.HK)在港交所挂牌上市。
随着公司登陆资本市场,智谱近日披露了清华大学计算机系教授、公司创始人兼首席科学家唐杰发布的一封内部信。信中回顾了智谱成立以来的技术探索历程,并预告新一代模型GLM-5即将推出。
唐杰在信中谈到,2020年,智谱推出了自研大模型算法架构GLM,并首次尝试训练百亿参数的基座模型。该模型随后获得了包括美团在内的多家企业的试用。然而,当时的成果距离实现通用人工智能(AGI)的宏伟目标依然遥远。部分原因在于模型的知识储备尚显不足,另一部分原因则在于模型还远未具备类似人类的推理思考能力。
时间来到2024年,大模型的发展之路也并非一帆风顺。当时,大多数人并不接受“让机器像人一样思考”这类近乎疯狂的宏大构想,他们认为这不亚于当年登月般的壮举。很多人也并未意识到这可能是一次前所未有的技术变革浪潮,甚至心存对失败的恐惧。尽管如此,智谱的团队还是决定全力以赴,投入更多数据训练规模达1300亿参数的大模型。
唐杰坦言,做出这个决定并不容易。为了不影响公司整体的发展节奏,公司同时组建了两个小型创新团队。其中一个团队专注于模型训练,即后来的“GLM三剑客”;另一个团队则独立负责MaaS平台的建设。
到了2024年中,GLM-130B模型成功发布,MaaS平台也如期上线,公司迎来了第一批真正的API用户。随后,团队正式成立了AI院,专注于下一代大模型的技术攻坚,并组建了MaaS平台部,负责对外提供大模型API服务。
2024年,唐杰深刻地认识到,AI不仅将颠覆传统的搜索与浏览器模式,还会为每个人带来一位全新的AI助手,这些变化将彻底重塑计算的底层逻辑。2024年至2025年,全球大模型领域迎来爆发,各大科技巨头纷纷宣布“All in”大模型。国内市场也掀起了一股创业热潮,“百模大战”激烈上演,各类AI助手层出不穷。唐杰复盘时提到,团队在技术路线和商业策略上也走过弯路。原因在于,在追逐AGI的道路上,短期的收益诱惑和市场的喧嚣曾让团队一度迷失方向。
幸运的是,DeepSeek的出现给团队敲响了警钟,当然,也带来了挑战。唐杰表示,在2025年年初的那段艰难时期,“一切都不容易。模型效果不及预期,市场价格战异常激烈,要想杀出重围,必须找到一个精准的突破口。”最终,团队将重心确定为Coding方向。从4月GLM-4.1的尝试性发布,到7月底GLM-4.5的“决战时刻”,所有技术、平台和业务团队都拧成了一股绳。最终,全球184个国家的15万名开发者使用了“GLM+Coding+Plan”服务。在GLM-4.7发布后,公司MaaS平台的ARR年化收入一举突破5亿元(其中海外收入超过2亿元),从2000万元增长到5亿元,实现了25倍的飞跃,而这一进程仅用了10个月。
过去一年,行业讨论主要聚焦于大模型的应用与生态建设,但唐杰认为,真正决定下一阶段竞争格局的,其实是更为底层的两件事——模型架构与学习范式。同时,在应用侧可能会涌现出一个清晰的方向:AI替代不同工种/任务的爆发之年。
基于此,唐杰强调,2026年公司将聚焦于GLM-5基座大模型的研发、全新的模型架构设计、具备更强泛化能力的强化学习(RL),并对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。
在人才引进与前沿技术探索方面,智谱也启动了新的举措:设立全新部门X-Lab,致力于以开放的方式聚集更多年轻人,开展前沿性探索,涵盖模型架构、认知范式,并孵化新项目,其范围并不局限于软件或硬件。同时,公司也将扩大对外投资,以贯通整个行业生态。
