昨天(10月22日),Stability AI 正式推出了 Stable Diffusion 3.5。对于长期关注开源 AI 文生图领域的用户而言,这一发布无疑是一个重要的里程碑——意味着开源社区终于迎来了一位真正具备竞争力的重量级模型。

此次发布并非单一模型,而是一个完整的“全家桶”阵容:共包含三个规模版本——Medium(10 月 29 日上线)、Large 和 Large Turbo,分别面向科研爱好者、个人玩家、初创公司乃至企业级用户的不同使用场景。具体来看:
- Stable Diffusion 3.5 Large:拥有 80 亿参数,是目前 SD 系列中性能最强的模型。响应迅速、生成质量高,特别适用于 100 万像素分辨率的专业级应用——生成的图像不再是“仅供参考”,而是能够真正投入使用的画面。
- Stable Diffusion 3.5 Large Turbo:可视为 Large 的“加速版本”。在提示词跟随能力上依然表现出色,仅需 4 步即可生成高质量图像,速度明显优于 Large——对于需要快速迭代的工作流程而言,这个版本极具吸引力。
- Stable Diffusion 3.5 Medium(10 月 29 日上线):25 亿参数,搭载改进的 MMDiT-X 架构和训练方法。其核心优势在于“开箱即用”——能够在消费级硬件上直接运行,并支持从 25 万到 200 万像素的分辨率范围。这意味着普通用户无需依赖云端或昂贵显卡,也能获得不错的出图效果。
值得注意的是,Stability AI 在博文中坦诚:此次发布并未完全达到他们自身的标准,也未完全满足社区的预期。因此,他们将继续打磨并开发一个更稳健的解决方案。这种坦诚在 AI 公司中并不多见,某种程度上也反映了开源模型面临的现实压力——既要追求性能,又要兼顾易用性和许可的开放性。
关于许可方面,Stability AI 这次表现得相当开放。他们推出了非常宽松的社区许可协议:非商业用途免费使用,年收入低于 100 万美元的企业也可免费商用。而年收入超过这一门槛的企业,则需单独申请许可。可以说,这一安排既照顾了个人用户和初创团队,也为商业化提供了清晰的路径——这正是开源社区真正期待的“诚意”。
