国产AI音乐模型登顶AA榜单,超越Suno与Udio表现

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
编辑|杨文、+0
先给大家听几首歌,猜猜哪首是 AI 生成的?
答案是:全部。
这些听起来与真人演唱无异的歌曲,均出自昆仑万维旗下的AI 音乐大模型 Mureka V8之手。
前几天,昆仑万维旗下的视频生成模型 SkyReels-V4,刚刚在 Artificial Analysis 的文生视频(带音频)榜单中拿下第一。
紧接着,旗下 AI 音乐大模型 Mureka V8 又在同一机构的榜单上,同时登顶 vocals(人声)和 instrumental(乐器)双榜第一,综合实力超越 Suno V4.5、Udio v1.5 Allegro、Lyria 2 等国际主流 AI 音乐模型,成为目前全球综合能力最强的 AI 音乐模型。

图片来源:https://artificialanalysis.ai/music/leaderboard/vocals

图片来源:https://artificialanalysis.ai/music/leaderboard/instrumental
Artificial Analysis 在业界素有「AI 领域 Gartner」之称,是当前全球最具影响力的 AI 大模型独立评测机构之一。它的评测强调独立性,所有测试均由机构内部完成,不依赖 AI 实验室自行报告的数据,评测结果曾被 OpenAI、Anthropic、Google 等全球头部 AI 公司以及权威媒体认可和引用。
在这样的评测体系下拿到双榜第一,说明 Mureka V8 经过了最严苛的第三方检验。
当然,好看的榜单还需要真实体验来印证。接下来,我们还是老规矩,上手实测一番。
全球正式:https://www.mureka.ai/国内正式:https://www.mureka.cn/
一手实测,这个中国 AI 音乐模型有点东西
相比于之前版本,Mureka V8 最大的亮点是生成的音乐完全可以直接发行,人声更富情感,旋律也更有记忆点。
Mureka V8 提供「简易」和「自定义」两种模式。
「简易」模式下,只需输入一段歌曲描述便能直接生成完整歌曲,还可上传参考音频,模型会在理解创作意图的基础上完成完整编曲、人声演唱和混音输出。
它支持中英文及多语种,段落结构、情绪推进、唱法选择均可通过提示词介入控制。

先来首硬核 Phonk,提示词给的是「有种喝了第 4 杯浓缩咖啡带来的亢奋」,听听看,是不是还没到一半就开始抖腿了?

或者输入「生成一首春日小曲」,其他啥也不用管,不到 30 秒,Mureka V8 直出两首轻松欢快的民谣。温柔的演唱配合柔和的编曲,让人听完就想出门晒太阳。

说唱风格也能 hold 住。我们输入提示词:中文说唱,男声,歌词关于城市里的漂泊与奋斗,节奏感强,带有嘻哈风格的 beat。

咱先不聊音乐性,看看这歌词写的:「红绿灯闪烁着这座城冷漠的频率,无数个灵魂在斑马线上交错浮沉,我抬头看那云端上高耸的起重机,正一点点吊起我那颗悬空的野心……这座城从不承诺谁会衣锦还乡,只在每一个深夜里审视你的顽强」,很有画面感和象征性的隐喻。
我们再来整个活,专门测一下 Mureka V8 的口条:生成一首高速中文流行说唱,女声主唱,歌词包含大量绕口令和密集辅音,比如「四是四,十是十」,要求咬字清晰、节奏贴合鼓点、情绪有推进。

有一说一,听感很不错,唱词比很多年轻演员的台词还清晰(doge)。
如果懒得想提示词,我们还可以使用「投骰子」功能,让其随机生成。那主题就五花八门了,什么打字机有节奏的敲击声、油渍里的彩虹色、抓不到的那只嗡嗡叫蚊子、健身房里嗓门巨大的肌肉男,啥都能拿来做成音乐。

(提示词:抓不到那只嗡嗡叫的蚊子)
自定义模式就进阶一些,不仅可以选择风格和人声,还能直接输入歌词,把一首歌从情绪到表达完全掌控在自己手里。
前段时间,一首叫《菩萨鱼》的 AI 歌曲火遍全网,它之所以爆火,是因为 AI 用慵懒冷峻的旋律和充满反讽的哲思,唱出了人类在现实规训下的挣扎与无奈,那种反差感直击灵魂。
顺着这个思路,我们也来复刻一首。我们要用 AI 来唱一首「反抗 AI 与算法」的歌,主题是:科技没有让人更轻松,反而把我们变成了更精致的零件,让人越发焦虑。
这一次,我们直接给 Mureka V8 喂入完整歌词,并明确设定风格。

大家可以直接跳转到 30s、56s、2m26s 欣赏 Mureka V8 的神仙转音。

拿下双榜第一,AI 音乐如何拥有「灵魂」?
Mureka V8 在 Artificial Analysis(AA)评测中,人声与乐器双榜单取得第一的成绩,是其底层技术架构长期演进的量变引起质变。在过往的 AI 音乐生成赛道中,行业普遍面临着旋律缺乏发展、编曲元素停滞不前、人声机械化以及听感扁平化等核心技术瓶颈。Mureka V8 与即将发布的 V9,正是针对这些真实创作痛点给出的系统性技术解法。
不仅要「能出声」,更要工业标准的「能打」
Mureka V8 的技术进步,标志着 AI 音乐从「实验性声音段落」的生成,向具备完整审美价值的「音乐作品」迈进。
在生成逻辑层面,V8 显著提升了音乐的结构完整性与动态发展能力。与以往简单循环片段的输出不同,V8 能够构建出清晰的主副歌对比、具有记忆点的旋律以及完整的段落结构。
在声学表现上,V8 在人声的表现和编曲层次上也进行了深度优化。通过精准匹配人声音色与唱法,模型能赋予虚拟演唱者更强的「主唱存在感」与情感张力。
此外,混音与声场构建技术的提升,让 V8 的配器更加饱满,混响比例与空间层次接近专业音乐制作水准,显著消除了早期 AI 音乐中的「粗糙感」与「干涩感」。
MusiCoT 构建思维闭环,让 AI 真正「听懂」审美
支撑 Mureka 核心模型持续进化的基础技术,是昆仑万维自研的MusiCoT(Music Chain-of-Thought)技术体系。自 2024 年初启动以来,研发团队逐步完成了评测、后训练与强化学习的技术闭环。

Mureka 自研基于 MusiCoT 的自回归模型音乐生成技术(来源:MusiCoT.github.io)
与传统依赖文本提示进行线性自回归生成、容易偏离人类创作模式的模型不同,MusiCoT 在技术链路上进行了创新重构。它引入了中间推理机制,使模型在生成具体的音频 token 之前,能够先自主「思考」并预定义整体的音乐结构、风格与乐器配置。同时,该体系底层依托 CLAP(对比语言-音频预训练)架构,在同一个表征空间内对文本与音频进行对齐训练。
这种深层次的协同建模能力,使模型在旋律推进、段落表达与音色安排之间建立了内在一致性。通过将复杂的音乐理论转化为模型可理解的推理链路,MusiCoT 成功地将主观的「好听」转化为了可高频复现的系统性能力,让 AI 具备了驾驭宏大音乐叙事的基础。
V9 提前看:攻克词不达意,让每一次创作都如你所愿
在 V8 打下的音质与乐感基础上,Mureka V9 将技术演进的重点放在了「创作意图的可控表达」上。如果说 V8 主要解决的是「质感」问题,V9 则致力于消除 AI 生成与创作者意图之间的「表达偏差」。
V9 进一步深化了 MusiCoT 的细粒度控制能力,优化了推理链路,显著提高了文本到音乐的处理效率与生成速度。在控制精度方面,V9 实现了对段落内文本的精准把控,能够准确理解歌词中的语义重心、情绪转折与演唱意图,从而确保歌词在对应的音乐段落中得到「恰如其分」的表达,同时有效减少了无意义的哼唱和模糊的唱词。
此外,V9 在生成结果的多样性与混音质量上持续优化,推动 AI 音乐技术从「高质感生成」向影视、游戏等全场景赋能的「精准定制」迈进。
3 月 27 日,Mureka V9 将在昆仑万维相关发布活动中正式亮相,届时其完整能力边界也将进一步揭晓。

结语:
从 SkyMusic 到 V9,
昆仑万维这条路走了多远
回看 Mureka 的进化轨迹,这次登顶并非一蹴而就。
早在 2024 年 2 月,昆仑万维就开始搞 AI 音乐大模型研发,不过彼时还在用一个叫 SkyMusic 的内测版本跑通最基础的训练、推理和评测闭环,目标也只是实现端到端「能用」。
此后两年,昆仑万维几乎每隔几个月就有一次技术跃迁。

2024 年 4 月,中英文版本上线天工,开始验证线上交付与稳定迭代;8 月做了首个超大规模版本,听感和音质有明显提升,独立产品也同步上线;11 月,多语种工程化落地,能力从双语变成多语种,可维护可迭代;2025 年,MusiCoT 和更系统化的评测、后训练、强化学习跑成闭环,模型进入有节奏、有方向的长期进化;2026 年 1 月,Mureka V8 正式发布,并在短短 2 个月登顶国际权威榜单。
AI 音乐的边界,还远没有到头。
技术归根结底是为表达服务,下次想写首歌记录生活,或者给自己的 Vlog 配个专属 BGM,不妨去正式亲自捏一首试试。
至于它的真实听感到底能不能打动你?你的耳朵说了算。
文中视频、音频链接:https://mp.weixin.qq.com/s/Gnc7WHgdvneyPoUN-peTUA
相关攻略
IT之家 3 月 31 日消息,据《滚石》杂志的深度调查显示,AI 生成工具正迅速渗透专业音乐制作领域,但整个行业却对此讳莫如深。今年早些时候,Suno 首席执行官米奇 · 舒尔曼接受《卫报》采访时
3月31日消息,据媒体报道,百沐娱乐最新微博发布“关于单依纯「纯妹妹2 0」2026巡回演唱会武汉、郑州场次票务安排的公告”。公告显示,因艺人方及主办方充分保障各位观众的权益,经综合考虑,现针对本次
内娱又有明星正面开撕啦!41岁歌手李荣浩公开指责单依纯侵权,发了长文炮轰对方在没有拿到授权的情形下强行演唱了李荣浩原创歌曲《李白》,不愧是原创歌手,自己靠自己吃饭就是硬气。目前单依纯本人已经回应了,
最近有和我一起追《逐玉》、嗑张凌赫和田曦薇CP的评论区举手!《逐玉》这剧真的越看越上瘾,我一口气看了12集:一边是曾庆杰导演发挥稳定,光影设计精致,把张凌赫田曦薇这人的美貌还原得刚刚好;一边是CP线
智东西编译 杨京丽编辑 李水青智东西3月26日消息,谷歌于当地时间3月25日发布了AI音乐生成模型Lyria 3 Pro。作为上月发布的Lyria 3的进阶版本,Lyria 3 Pro由谷歌Deep
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





