据了解,腾讯混元今日正式开源其重磅打造的"混元图像3.0"原生多模态图像生成模型,该模型拥有惊人的800亿参数量级。值得注意的是,这是业内首个开源的工业级原生多模态图像生成系统,据官方测试,该模型的图像生成质量已达到主流闭源模型的水平。
特别值得一提的是,"混元图像3.0"具备知识推理这一突破性能力,不仅可以精准理解长达千字的复杂语义输入,更能按要求生成包含大量文本信息的图像内容。
本次发布的3.0版本是对5月间发布的2.0版本的重要升级。回顾2.0版本,已实现了两大关键技术突破:一是达到毫秒级的实时响应速度,二是支持超写实风格的高质量图像生成。特别之处在于,其独创的即时预览功能能让用户在输入文字过程中就实时看到生成的画面效果。
事实上,腾讯混元系列此次开源并非首例。此前该团队已陆续开放了多款创新模型的源代码,包括2.0和2.5版本的3D生成模型、InstantCharacter角色定制插件,以及HunyuanCustom多模态视频生成工具。这一系列开源动作标志着腾讯在构建涵盖图像、视频、3D等领域的完整AIGC技术版图上迈出了坚实步伐。
