近期,智谱AI的一项举措引发业界广泛关注——其GLM-4-Flash大模型的API接口已全面免费开放。在当前主流大模型仍普遍采用Token计费的市场格局下,这一免费策略堪称一次大胆且具有颠覆性的尝试。
接下来了解该模型的核心特性。GLM-4-Flash在推理速度与综合性能方面表现卓越。通过引入自适应权重量化、并行处理、批处理策略以及投机性采样等多种优化技术,其稳定输出达到72.14 token/s。这一速度在同类开源模型中位居第一梯队,对于需要高实时响应的应用场景而言,无疑是一大利好。

再看其性能基础。预训练阶段,智谱AI使用了10TB的高质量多语言数据集,使模型具备多轮对话、网页搜索、工具调用等丰富能力,并支持最长128K的上下文窗口,能够轻松应对长文档处理与复杂对话任务。在语言覆盖上,模型支持中、英、日、韩、德等26种语言,在多语言应用场景中展现出卓越的实用价值。
为满足不同用户的个性化需求,智谱AI还开放了模型微调功能,让开发者能够轻松将GLM-4-Flash适配至特定业务场景。免费API搭配微调能力,大幅降低了开发门槛——对中小团队及个人开发者而言,这无疑是一次不可错过的机遇。
接口调用地址:https://open.bigmodel.cn/dev/api#glm-4
