最近,智谱官方发布了一则公告,其中透露了不少值得关注的信息。简单来说,随着 GLM-4.7 模型正式上线,GLM Coding Plan 的用户量迅速飙升,直接导致算力资源面临较大压力。在高峰时段(尤其是工作日下午三点至六点),不少用户遇到了限流提示、响应延迟甚至推理卡顿等问题——根本原因在于并发请求量过大,服务器承载能力暂时达到瓶颈。

技术团队反应较为迅速,已紧急启动算力扩容计划。但为了确保现有用户的服务体验不受影响,官方同步推出了几项临时调整措施:
- GLM Coding Plan 即日起改为限量发售——每日可售配额缩减至原有水平的20%,优先保障现有活跃用户的算力供应,从而维持编程体验的稳定性。本轮限售自1月23日早上10点正式开始,此后每天10点更新剩余额度。已开通自动续订的用户完全不受影响,服务照常运行。何时恢复不限量销售?取决于扩容进度,官方将另行通知。
- 加强流量管控与异常行为识别能力。具体而言,恶意刷量、高频低质量的调用请求将被重点监测与限制,情节严重者将面临封禁处理,坚决防止非理性占用拖累整体服务质量。
公告中还有一段真诚的表述:“我们正全力推进更先进、更高性能的新一代模型研发,并同步加快基础设施建设节奏。更卓越的 GLM Coding Plan 将在不久后如期而至。短期的限量调控,是为了兑现长期稳定的高品质服务承诺。”——用更直白的话说就是:更好的产品很快就能用上,现在稍微忍耐一下,后续体验会更出色。
