首页 游戏 软件 资讯 排行榜 专题
首页
AI教程
智谱AI开源绘图模型CogView4功能详解与应用指南

智谱AI开源绘图模型CogView4功能详解与应用指南

热心网友
53
转载
2026-05-25

智谱开源AI绘图CogView4,曾经的开源之光回来了!

开源世界的繁荣,似乎正以一种令人应接不暇的速度上演。就在昨天,智谱AI宣布获得杭州10亿融资,而今天,其与清华大学团队联合开源的AI绘图模型CogView4便已正式发布。这节奏,快得让人喘不过气。

回顾上周,从DeepSeek连续五天的硬核技术开源,到阿里通义万相2.1的发布,再到Qwen推理模型的预览,开源领域的拼图正在被一块块迅速补全。如今,CogView4的到来,无疑为2025年的开源版图增添了关键一块。

模型已在GitHub上公开,地址为:https://github.com/THUDM/CogView4。这是一个60亿参数的模型,根据官方提供的GPU需求估算,在BF16精度、batch size为4的情况下,最低可能仅需一张12GB显存的显卡即可运行。

为了快速验证,我们在一台A800-80G的云服务器上进行了部署测试。生成一张1024*1024分辨率的图像大约需要70秒,考虑到云服务的网络延迟,本地部署的速度预计会更快。当然,对于想直接体验的用户,智谱官方也提供了在线服务:https://modelscope.cn/studios/ZhipuAI/CogView4。

经过初步测试,CogView4有两个特点值得关注。

原生支持中英文字生成

首先,CogView4原生支持在图像中生成中英文字符。这在开源AI绘图模型中尚属首次。虽然市面上已有类似能力的闭源模型,但开源带来的可定制性和透明度是完全不同的。

从测试结果来看,其文字生成能力,尤其是中文,准确率还有提升空间,错别字率相对英文更高。推测其处理方式可能是将文字信息与视觉信息一同输入模型进行端到端生成,而非采用专门的文字渲染模块。这导致其在复杂审美和色彩搭配上,与当前顶尖的闭源模型存在一定差距。

然而,其优势恰恰在于“开源”二字。对于开发者而言,这提供了一个绝佳的基座模型。完全可以基于CogView4,使用更高质量、更具设计感的数据集进行微调,从而训练出专精于海报设计、Logo生成等垂直领域的强大模型。开源释放的正是这种可能性。

强大的语义理解与构图能力

第二个特点是其出色的语义理解和复杂构图能力。在测试中,无论是包含多个时空分区的超宽画卷,还是融合具体诗句意境的场景,模型都能较为准确地理解提示词中的空间关系、物体属性和文化元素,并将其组织到一幅连贯的画面中。

这种能力的提升,很大程度上得益于其文本编码器从T5换成了更强大的GLM4。这使得模型能更精准地捕捉自然语言描述的细微差别。

此外,模型在出图分辨率上提供了较高的灵活性,支持在2048像素以下进行几乎无级的比例调节。官方还表示,后续将支持ComfyUI工作流和ControlNet控制网络套件,并会提供微调脚本。这些工具的支持,将极大地方便开发者和研究者基于CogView4进行二次创作与优化。

目前开源的模型采用Apache 2.0协议。面向普通用户的版本,也计划于3月13日在智谱清言App中上线。

回归的开源之路

最后,不妨将目光放回智谱AI这家公司本身。在国内大模型厂商中,智谱曾是最早、最坚定的开源倡导者之一。早在2023年,其开源的ChatGLM-6B模型便风靡一时,在GitHub上收获了数万星标,成为许多开发者和企业进行模型微调与应用的起点。

随后,GLM-4、GLM-4-Voice、CogVideoX、CogAgent等一系列模型的开源,持续巩固了其“开源先锋”的形象。然而,随着2024年市场竞争加剧,其他厂商在开源领域也频频发力,智谱在开源社区的声量似乎有所减弱。

此次CogView4的发布,或许是一个明确的信号。在官方仓库的一张Demo图中,智谱将2025年定义为自己的“开源年”。这像是一种回归,也是一种宣言。

开源生态的繁荣,最终受益的是整个行业和所有开发者。每一家厂商在技术上的突破与开放,都如同增添了一盏灯火,共同照亮中国AI前行的道路。期待这片江湖,因更多这样的贡献而愈发蓬勃兴盛。

来源:https://www.uisdc.com/cogview4
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

MasterBOT币BOT潜力分析:能否成为AI加密货币领域的下一个巨头
web3.0
MasterBOT币BOT潜力分析:能否成为AI加密货币领域的下一个巨头

MasterBOT(BOT)是一个融合人工智能(AI)、Web3 和机器人技术的创新项目,旨在通过去中心化的方式训练下一代机器人智能。其核心机制是利用虚拟仿真环境进行 AI 模型训练,并通过社区参与的预测市场进行激励。 MasterBOT(BOT)简介 简单来说,MasterBOT 构建在 Sola

热心网友
05.25
AI写作助手Compose AI:智能辅助高效创作
AI教程
AI写作助手Compose AI:智能辅助高效创作

在人工智能技术深度赋能各行业的当下,智能写作工具正迎来关键性演进。作为一款前沿的AI写作助手,Compose AI凭借其独特的设计思路与技术架构,在众多工具中脱颖而出。它不仅仅提供基础的文本补全功能,更致力于深入理解每位用户的个人表达习惯,并结合上下文语义,为写作者提供从用词、句式到篇章结构的全方位

热心网友
05.25
AI时代如何避免错别字并保持文案的人性化表达
AI资讯
AI时代如何避免错别字并保持文案的人性化表达

「今天天汽真不错。」 看到这条消息,你大概会笑作者打字太不走心,但绝不会怀疑这是AI写的。原因很简单,AI生成的文案或许越来越工整,却总缺了那么点“人味儿”;反倒是真正的人类输入,还保留着手滑、分心和没来得及检查的鲜活痕迹。 不知不觉间,错别字这种曾经的瑕疵,竟成了验明“人类正身”的防伪标签。 为了

热心网友
05.25
李飞飞团队ESI-Bench解读AI如何从旁观者进化为行动者
AI资讯
李飞飞团队ESI-Bench解读AI如何从旁观者进化为行动者

近日,李飞飞团队发布的ESI-Bench(具身空间智能基准)在人工智能领域引发了广泛关注。这一基准被许多研究者视为具身智能发展的里程碑,它系统性地揭示了当前最先进的大语言模型在理解和交互物理空间时存在的核心瓶颈。 3 元认知缺陷:AI缺乏自知之明 这或许揭示了人类智能与当前人工智能之间最根本的差异

热心网友
05.25
领英打击AI生成低质内容 违规账号将被限流处理
AI资讯
领英打击AI生成低质内容 违规账号将被限流处理

近期,职场社交平台领英(LinkedIn)展开了一项备受关注的专项治理行动:全面清理平台上由AI生成的低质“水文”。随着ChatGPT等生成式AI工具的广泛应用,不少用户开始批量生产内容,导致平台涌现大量观点雷同、缺乏深度洞察的“正确的废话”,这不仅严重影响了用户的阅读体验,也损害了社区的内容生态与

热心网友
05.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

伴鱼个性化学习如何通过动作定制提升效果
科技数码
伴鱼个性化学习如何通过动作定制提升效果

个性化学习已进入“动作”定制时代,系统通过动态分析学生数据构建个人知识图谱,实时规划学习路径、讲解方式与复习节奏。例如针对错题追溯前置薄弱点并调整讲解方法,实现从结果纠错到过程归因的转变,使大规模因材施教成为可执行、可量化的科学实践。

热心网友
05.25
河北信息通信业发展领先全国主要指标位居前列
科技数码
河北信息通信业发展领先全国主要指标位居前列

2025年,河北信息通信行业交出了一份令人瞩目的高质量发展答卷。核心发展指标持续领跑全国,稳居第一梯队,行业竞争优势与领先地位得到全面巩固,为河北省经济社会数字化转型构筑了坚实可靠的数字基石。 这份优异成绩,首先得益于信息基础设施的跨越式升级。全年行业固定资产投资完成115 2亿元,规模位列全国第九

热心网友
05.25
天宫空间站首次迎来香港航天员太空会师
科技数码
天宫空间站首次迎来香港航天员太空会师

北京时间2026年5月25日凌晨,中国空间站迎来又一里程碑时刻。神舟二十三号载人飞船经过约3 5小时的快速交会对接,于2时45分精准对接于天和核心舱的径向对接口。 对接约2 5小时后,舱门顺利开启。已在轨长期驻留的神舟二十一号乘组航天员,热情迎接了新战友入驻。此次“天宫会师”具有双重重要意义:它不仅

热心网友
05.25
三国计手游新手攻略:核心玩法详解与快速入门指南
游戏资讯
三国计手游新手攻略:核心玩法详解与快速入门指南

竖屏SLG手游《三国计》近期开启限时测试。其竖屏设计降低了操作门槛,便于单手游玩,同时保持了紧凑的界面布局与策略深度。玩家扮演乱世诸侯,目标是从生存壮大到问鼎中原。新手期建议紧跟主线任务,以解锁武将、兵种、科技等核心系统,并获取关键资源平稳度过开荒阶段。

热心网友
05.25
微软支付2.5亿美元和解动视暴雪股东诉讼 每股赔偿30美分
游戏资讯
微软支付2.5亿美元和解动视暴雪股东诉讼 每股赔偿30美分

一场历时四年、牵动全球游戏与科技界目光的动视暴雪股东集体诉讼案,迎来关键性进展。微软同意支付高达2 5亿美元的和解金,与提起诉讼的股东达成和解,为这场旷日持久的法律纠纷画上了阶段性句号。 根据2026年5月下旬于美国特拉华州衡平法院披露的和解协议文件,这笔巨额资金将用于赔偿在特定时间段内持有动视暴雪

热心网友
05.25