蚂蚁开源Ming-Flash-Omni 2.0:全模态模型性能对标Gemini 2.5 Pro
2月11日消息 今日,蚂蚁集团正式开源发布了全模态大型模型 Ming-Flash-Omni 2.0版本。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力上表现突出,部分指标甚至超越了 Gemini 2.5 Pro,堪称开源全模态大模型领域的性能新标杆。
Ming-Flash-Omni 2.0 也是业界首个可实现全场景音视频统一生成的模型,能够在同一条音轨中同步生成语音、环境音效与背景音乐。
用户仅需使用自然语言描述指令,即可实现对音色、语速、语调、音量、情绪与方言等进行精细控制。
模型在推理阶段实现了3.1Hz的极低推理帧率,能够以分钟级长度实现音频的实时高保真生成,在推理效率与成本控制方面保持业界领先。

蚂蚁集团在全模态方向已持续投入多年,Ming-Omni 系列历经三个版本的迭代。此次将 Ming-Flash-Omni 2.0 开源,意味着其核心能力以“可复用底座”的形式对外释放,为端到端多模态应用开发提供了统一的能力入口。
据了解,Ming-Flash-Omni 2.0基于 Ling-2.0 架构训练,围绕“看得更准、听得更细、生成更稳”三大目标进行全面优化。
视觉方面,融合了亿级细粒度数据与难例训练策略,显著提升了对近缘动植物、工艺细节和稀有文物等复杂对象的识别能力;
音频方面,实现语音、音效、音乐同轨生成,支持通过自然语言精细控制音色、语速、情绪等参数,并具备零样本音色克隆与定制能力;
图像方面,增强了复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能,在动态场景中仍能保持画面连贯与细节真实。
目前,Ming-Flash-Omni 2.0 的模型权重、推理代码已在开源社区发布。用户也可通过蚂蚁百灵最新平台 Ling Studio 进行在线体验与调用。
相关攻略
3月17日消息,在上海交通大学建校 130 周年之际,今日,蚂蚁集团董事长、1994 届本科校友井贤栋,与同届校友夫人共同向母校捐赠1 3 亿元现金及蚂蚁集团股份,捐赠签约暨校董聘任仪式在交大闵行校
蚂蚁集团收购耀才证券金融集团有限公司(耀才证券金融,01428 HK,以下简称“耀才证券”)获批,公司股价3月17日复牌后飙升,盘中一度涨超82%。截至3月17日午间收盘,耀才证券金融股价涨65 9
21世纪经济报道 杨梦雪继3月16日夜间公布蚂蚁要约收购获核准公告后,3月17日开盘,耀才证券金融(HK 01428)股价一路飙涨,盘中最高涨超80%,盘中最高16 88港元 股。3月16日晚间,耀
3月17日,截至发稿,耀才证券金融(01428 HK)涨64 62%。根据公告,蚂蚁集团发起的要约收购已通过中国有关部门审批,预计将于3月30日完成交割。
3月17日,香港老牌券商耀才证券金融(01428 HK)复牌后股价飙升,盘中一度涨超80%,截至9时55分,涨幅为57 82%,报14 63港元 股。消息面上,蚂蚁集团收购耀才证券迎来最新进展。根据
热门专题
热门推荐
可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存
3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A
南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天
来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年
大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确





