1月29日,人工智能公司MiniMax(稀宇科技)正式发布MiniMax Music 2.5模型。官方表示,该模型在“段落级强控制”与“物理级高保真”两大技术难题上取得关键突破——能让创作意图更精准地转化为音乐,让生成的音乐听感更真实自然,甚至宣称格莱美级别的创作“不再需要录音棚”。

MiniMax Music 2.5 全面开放了全段落标签控制功能。它精准支持包括 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺垫)及 Hook(副歌)在内的14种结构变体,能够承载高复杂度音乐的创作表达。
用户现在可以像专业编曲人一样,在创作之初就规划好整首歌曲的情绪曲线、高潮位置和乐器配置,而不是生成后再靠运气去调整拼接。
通过对人声生成、风格建模、混音处理的系统性优化,MiniMax Music 2.5 让AI音乐在听感上达到了“专业制作水准”。
该模型针对华语流行音乐进行了深度优化,覆盖了从慢歌到说唱、从纯中文到中英文混搭的各类场景,在可听性与传播性上实现了系统性提升。

通过对人声合成的优化,MiniMax Music 2.5 实现了连续细腻的转音、自然起伏的颤音,以及胸腔与头腔共鸣的灵活切换,声音表现力显著增强。在男女对唱中,声线也不再是简单的叠加,而是具备了自然的协同感,问答交替、和声层次分明。
MiniMax Music 2.5 将音色库扩充至100多种乐器,并优化了混音处理,能够保持人声与伴奏的清晰分离,解决了AI音乐中常见的声音混叠问题,即使在乐器密集的场景下也能保持各声部清晰。
此外,MiniMax Music 2.5 深度适配专业工作流。无论是充满叙事感的影视配乐、沉浸式游戏的动态声场、录音室级别的流行工业成品,还是为品牌设计的风格化声效等场景,官方宣称其均能达到专业交付标准。
