游乐游手机版
首页/业界动态/文章详情

京东开源图像大模型性能媲美谷歌Gemini 2.5 Pro

时间:2026-05-12 19:54
2026年4月,国内多模态AI领域迎来一位聚焦场景的新选手。京东正式发布了一体化空间图像编辑大模型JoyAI-Image-Edit。根据公开的基准评测,其综合性能已追平谷歌的旗舰模型Gemini 2 5 Pro,而在空间结构编辑这类特定任务上,表现甚至优于当前的主流视频生成模型。 这背后,其实反映出

2026年4月,国内多模态AI领域迎来一位聚焦场景的新选手。京东正式发布了一体化空间图像编辑大模型JoyAI-Image-Edit。根据公开的基准评测,其综合性能已追平谷歌的旗舰模型Gemini 2.5 Pro,而在空间结构编辑这类特定任务上,表现甚至优于当前的主流视频生成模型。

这背后,其实反映出一个清晰的行业转向:全球大模型的竞争,正从通用能力的军备竞赛,悄然过渡到落地能力的实战比拼。成本高、场景适配难、训练数据匮乏,这些老问题依然是横亘在商业化道路上的普遍障碍。于是,我们看到头部科技公司不再一味追求参数的膨胀,而是开始结合自身的“老本行”,探索差异化的AI路径。

京东的AI布局,就是一个典型的例子。其路线始终紧扣供应链这一核心优势,重点押注在**空间智能与具身智能**方向上。目标很明确:让AI的能力,最终能对接并服务于物理世界的真实需求,而不是停留在对话和文本生成的层面。

JoyAI-Image-Edit:一款为“空间”而生的编辑工具

那么,这次推出的JoyAI-Image-Edit究竟有何特别?简单说,它是一款专为“空间场景”的生成与编辑需求而深度优化的一体化模型。

从公开数据看,它的整体基准性能达到了国际顶流水平。更值得关注的是,在诸如“按要求修改室内家具布局”或“生成一张符合真实物理透视的街景图”这类任务上,它的表现超越了主流视频模型。这意味着,它在理解和操控图像中的空间关系、物体结构方面,具备了相当高的精度。

这种垂直定位,让它天生就适配两类核心场景:

其一,是电商领域。商品主图的场景替换、营销广告图的快速生成,这些高频需求对成本和控制精度极为敏感。其二,则是具身智能的研究。训练一个机器人理解物理世界,需要海量、多样且标注准确的虚拟空间数据,而人工制作成本极高。JoyAI-Image-Edit恰好能提供一种低成本、高效率的解决方案。

开源与落地并行的务实策略

在推进策略上,京东这次选择了一条颇为务实的“双线并行”道路:一手开源,一手落地。

模型代码直接对外开放,这无疑能吸引全球开发者社区共同参与迭代和优化,加速模型本身的进化。与此同时,内部的应用测试已经启动。据悉,其智能编辑功能正在京东自身的电商场景中进行测试。后续,它还将作为一项基础设施,为具身智能研究领域提供低成本的数据生成服务。

这种策略,与许多先闭源变&现再逐步开放的垂直模型路径形成了鲜明对比,显得更加开放和生态化。

话说回来,这款国产模型的表现,至少证明了一点:在垂直细分的人工智能领域,国内厂商完全有能力追平甚至超越国际顶尖水平。而依托自身核心业务场景去打磨专用模型的路线,也为当前整个AI行业如何突破落地瓶颈,提供了一个新的参考方向。可以预见,空间智能这条赛道,接下来会变得更加热闹。

来源:https://cxgn.cn/12397.html
上一篇生数科技获阿里云领投近20亿元B轮融资 清华系AI企业加速发展 下一篇谷歌Gmail移动端加密升级 端到端加密守护邮件隐私安全
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿