1月16日传来消息,智谱AI今日宣布,其与华为联合开源的新一代图像生成模型GLM-Image,在开源后不到24小时内,便登上全球知名AI开源社区Hugging Face榜单的全球首位。
智谱方面表示,这是首个完全依托国产芯片训练而成的国产模型在国际舞台上取得榜首位置,标志着国产AI模型端到端的自主研发能力在国际竞争中实现重要突破。
据了解,GLM-Image基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架,完成了从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。

在模型架构上,GLM-Image不同于开源领域常用的LDM方案,创新性地采用了自回归与扩散解码器的混合架构,能够同时兼顾全局指令理解与局部细节刻画。
性能方面,GLM-Image在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单上均获得开源第一,它能够准确理解指令、书写对文字,尤其擅长汉字生成任务,可广泛应用于海报、PPT、科普图等知识密集型场景。
在商业化应用层面,GLM-Image采用API调用模式,单张图片生成成本仅为0.1元,大幅降低了企业与开发者使用先进图像生成技术的门槛。

