阶跃星辰近日正式上线了旗下图像生成大模型 Step-1X,目前该模型已在开放平台体验中心开放注册试用。早在2024年世界人工智能大会上,Step-1X 就曾与万亿参数语言大模型 Step-2 及多模态大模型 Step-1.5V 一同亮相。如今,这款模型正式面向公众开放,终于揭开了它的神秘面纱。
值得一提的是,Step-1X 此次还与上海电影合作,基于经典 IP《大闹天宫》打造了一款 H5 互动体验——“测测你是哪路神仙”。要知道,《大闹天宫》这类经典动画的可用数据资源相当稀缺,传统模型训练常因样本不足而导致生成效果不佳。然而,Step-1X 在有限的数据条件下依然实现了高质量图像生成,这一表现本身就值得业界关注。
从技术架构来看,Step-1X 采用了自研的 DiT(Diffusion Models with Transformer)模型架构,核心优势在于深度语义对齐与精细细节生成。该模型能准确理解复杂指令,甚至支持长达2000个字符的图像生成提示词。这意味着用户可以通过长文描述精确控制画面细节,而无需担心模型难以理解复杂的语义。
在灵活性方面,Step-1X 的应用范围十分广泛,涵盖广告创意、游戏美术、影视制作等几乎所有图像生成场景。最值得单独强调的是,它在处理中国元素与文化符号时展现出独特的优化优势——并非简单的“国风滤镜”,而是能够真正传达文化精髓的视觉表达。这种能力在整个行业内都较为罕见。
总体而言,Step-1X 的登场不仅补全了阶跃星辰在图像生成领域的产品版图,也为那些对中国文化内容有严格要求的创作场景提供了一个可靠的新选项。
