随着备受瞩目的大语言模型GLM-4.7发布,智谱AI迎来了用户量的激增,这导致了严重的算力资源紧张。为了保障服务稳定,公司不得不紧急采取限流措施。官方宣布,自1月23日起,其编程助手服务“GLM Coding Plan”每日新增订阅量将大幅缩减至原有水平的20%,同时承诺将优先保障现有用户的使用体验不受影响。
用户数量的快速增长,使得近期工作日下午的高峰时段频繁出现并发报错和响应速度显著下降的现象。智谱AI对此解释称,这是业务快速增长带来的阶段性资源紧张。这家本月刚刚在香港完成高调IPO的AI公司,正在与OpenAI、Anthropic等国际领先企业展开直接竞争。
为应对突如其来的流量高峰而采取限流措施,在高速增长的AI行业中并非孤例。去年,DeepSeek也曾因管理服务器容量而限制其API服务的访问。
算力紧张迫使限售措施出台
智谱AI通过微信最新声明确认,其GLM编程助手的限售措施将于1月23日上午10时正式启动,之后每日同一时间释放当日新增额度。公司表示,现有订阅用户的自动续订不受此次调整影响,但未说明限售措施将于何时结束。
GLM Coding Plan是一款对标Claude的AI编程助手服务。智谱AI解释称,近期由于用户量激增,在高峰时段已出现响应延迟与并发报错等服务质量波动。实施限售旨在优先保障已有用户的算力资源与使用体验。
行业普遍面临容量挑战
为应对用户激增引发的容量压力而采取限流措施,已成为AI行业高增长初期的常见现象。去年成为全球现象级产品的DeepSeek,也曾因服务器资源紧张而限制其API服务的开放访问。
此类“限售”行动背后,凸显出AI技术应用需求爆发式增长与底层算力基础设施建设速度之间的阶段性矛盾。随着大语言模型及编程助手等服务迅速普及,稳定、可扩展的算力供应已成为企业规模化扩张的关键制约因素。
对市场而言,算力瓶颈既印证了终端需求的强劲,也揭示了AI企业在运营层面从技术突破向稳定服务转型过程中面临的现实挑战。如何有效平衡用户规模的快速增长与服务质量和成本的可持续控制,正成为行业领军企业需要解决的核心战略议题。
