首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
美团开源LongCat图象模型:专攻中文场景与编辑功能

美团开源LongCat图象模型:专攻中文场景与编辑功能

热心网友
76
转载
2025-12-08

12月8日,美团LongCat团队正式宣布开源其图像生成与编辑模型LongCat-Image。这款模型拥有60亿参数,其独特之处在于采用了一套统一的架构,能够同时处理文本生成图像和基于自然语言指令进行图像编辑的任务。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

模型架构解读

根据介绍,LongCat-Image采用了图文生成与图像编辑同源的混合骨干架构(MM-DiT+Single-DiT),并整合了视觉语言模型条件编码器。它的核心技术创新点主要包括:

1. 生成与编辑合二为一:模型不仅能够根据文本提示生成图像,还可以通过自然语言指令对图像进行多轮精细编辑。官方列举了包括对象添加/移除、风格迁移、背景替换、文字修改在内的15类编辑任务,并声称在多轮编辑过程中能有效保持图像风格与光照的一致性。

风格迁移与属性编辑能力对比

2. 强大的中文文本渲染能力:该模型特别强调对中文文本生成的支持,宣称能够准确处理标准汉字、生僻字以及部分书法字体,并能根据场景自动调整字体、大小和排版。在技术实现上,模型通过预训练阶段学习字形轮廓,并在后续训练中引入大量真实世界的文本图像数据,以提升其泛化与应用能力。

文字生成效果对比

3. 高效的输出与优秀质量:通过模型结构轻量化与训练策略优化,该模型宣称可在消费级GPU上实现高效推理,并生成具备“摄影棚级别”丰富细节的高质量图像。

图像生成综合能力对比

在性能评估方面,官方公布了部分基准测试数据:

1. 在图像编辑基准测试GEdit-Bench和ImgEdit-Bench中,LongCat-Image得分分别为中英文综合7.60/7.64分以及专项4.50分,均达到了开源模型中的领先水平。

2. 在中文文本渲染专项测评ChineseWord中,其得分高达90.7分。

3. 在文生图基础能力测试GenEval和DPG-Bench中,其得分分别为0.87和86.8。

目前,该模型已在GitHub平台开源,用户可以通过LongCat APP或网页端(longcat.ai)体验其功能。团队表示,此次开源旨在支持从学术研究到商业应用的全流程探索,并诚挚邀请全球开发者社区参与共建。

此次开源动作,清晰地显示了美团在AIGC领域,尤其是针对中文市场及复杂图像编辑需求的技术布局。开源策略有助于其吸引开发者构建生态,并有望在快速发展的图像生成领域建立重要的影响力。

来源:http://tech.hexun.com/2025-12-08/222687131.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

MacBook Neo的P3广色域实测:为何难以全覆盖?
礼仪与书信
MacBook Neo的P3广色域实测:为何难以全覆盖?

IT之家 3 月 15 日消息,X 平台博主 @ZONEofTECH 前天发文称,苹果 MacBook Neo 笔记本可以手动切换到 P3 广色域,实际上可以显示 P3 图像。据介绍,MacBook

热心网友
03.15
荣耀Magic V6折叠屏拍摄样张公布:AI影像加持
礼仪与书信
荣耀Magic V6折叠屏拍摄样张公布:AI影像加持

IT之家 2 月 26 日消息,荣耀影像最新微博今日放出了荣耀 Magic V6 折叠屏手机的拍摄样张,新机将延续 AiMAGE 影像能力。IT之家注:去年 3 月,荣耀在 2025 年世界移动通信

热心网友
02.27
Seedream 5.0 Lite发布:实时检索能力提升智能图像创作
AI
Seedream 5.0 Lite发布:实时检索能力提升智能图像创作

2月13日,字节跳动Seed团队推出Seedream 5 0 Lite智能图像创作模型。相比4 0版本,模型在理解、推理和生成方面全面提升。作为通向统一多模态模型的进一步探索,它开始能像人类设计师

热心网友
02.13
Apple AI额度触顶过快?用户实测:50页PPT仅生成2个
AI
Apple AI额度触顶过快?用户实测:50页PPT仅生成2个

IT之家 2 月 13 日消息,科技媒体 Appleinsider 昨日发布博文,报道称苹果在其 Apple Creator Studio 套件中大力宣扬“无限创意”,但实际测试表明其生成式 AI

热心网友
02.13
谷歌Gemini拒生成迪士尼角色,最强法务部出手维权
AI
谷歌Gemini拒生成迪士尼角色,最强法务部出手维权

IT之家 2 月 11 日消息,去年 12 月,迪士尼向谷歌发出停止侵权函,指责其 AI 产品像“虚拟自动售货机”一样随意输出迪士尼的知识产权内容。时间来到近两个月后,外媒 Deadline 当地时

热心网友
02.11

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

华为鸿蒙6.0.0.328升级:透明质感、灵动物与动态效果全解析
网络安全
华为鸿蒙6.0.0.328升级:透明质感、灵动物与动态效果全解析

每次系统更新,用户最怕的是什么?不是新功能不够多,而是又卡了、又耗电了、更新了个寂寞,这也导致许多用户不敢尝鲜。不过随着各大厂商的内卷程度加深,以及对系统本身的工艺技术得到了进一步的提升,如今系统更

热心网友
03.28
Excel查找最后一项匹配公式详解:5步精准定位
电脑教程
Excel查找最后一项匹配公式详解:5步精准定位

Excel中定位值最后一次出现位置并提取结果,可用五种公式:一、LOOKUP(2,1 (条件),返回列);二、INDEX+MATCH数组公式;三、XLOOKUP(search,lo

热心网友
03.28
小米SU7深度试驾体验:日常驾驶亮点与真实用户评测
科技数码
小米SU7深度试驾体验:日常驾驶亮点与真实用户评测

在新能源汽车市场竞争愈发激烈的当下,小米新一代SU7凭借专业媒体试驾反馈中的亮眼表现,成为近期车圈焦点。这款车虽定位运动型轿车,却在日常驾驶舒适性上展现出独特优势,收获众多好评。多家媒体在试驾过程中

热心网友
03.28
深蓝汽车电驱突破百万台,新一代技术如何创新效率新高
科技数码
深蓝汽车电驱突破百万台,新一代技术如何创新效率新高

深蓝汽车近日迎来重要里程碑,其第100万台电驱系统正式下线,标志着该品牌在电动化领域迈出关键一步。与此同时,全新一代原力超集电驱技术揭开面纱,以94 13%的系统工况效率刷新全球量产电驱纪录,功率密

热心网友
03.28
中建材携手吉利 共建南非新能源全链条合作共赢蓝图
科技数码
中建材携手吉利 共建南非新能源全链条合作共赢蓝图

在南非约翰内斯堡举办的2026年国际太阳能暨储能展上,一场备受瞩目的签约仪式吸引了众多目光。中国建材集团旗下的中建材南非有限公司与吉利控股集团旗下的吉利南非有限公司,正式签署了南非新能源转型战略合作

热心网友
03.28