近期,Suno V3的横空出世在音乐行业引发了剧烈震荡。4月2日,超过200位知名音乐人联合签署了一封公开信,呼吁抵制AI对人类创作力的侵蚀。该信由艺术家权利联盟发布,要求科技公司承诺不开发那些旨在取代或削弱人类歌曲创作者的AI工具。签署名单中不仅有Billie Eilish、J Balvin、Nicki Minaj等顶流巨星,还包括Stevie Wonder、REM等摇滚名人堂成员。信函发布仅一天后,Stability AI便在X平台上推出了Stable Audio 2.0,这一时间点明显带有挑战意味。

产品介绍
Stable Audio 2.0是Stability AI开发的一款先进AI音频生成模型,能够根据文本描述或上传的音频样本,生成时长可达三分钟的高质量音乐作品,涵盖摇滚、爵士、电子、嘻哈等多种风格。其核心亮点包括:
- 高质量音乐生成:可输出44.1kHz高保真音乐,结构完整——引子、发展、尾声一应俱全,并带有立体声效果。
- 音频到音频转换:用户可上传音频样本,通过自然语言提示将其转化为不同风格。
- 效率显著提升:相比上一代,生成速度大幅提高,平均约一分钟即可生成一首三分钟长度的音乐。
- 海量数据训练:使用超过80万个音频文件、总计1.95万小时的数据进行训练,确保了音乐的细节与真实感。
- 商业化友好:与知名音乐服务商AudioSparx合作,生成的音乐可用于视频自媒体及商业广告。
- 多样下载格式:支持MP3、WAV、Video等多种格式。
玩法指南
操作流程非常简便。第一步,访问Stable Audio 2.0官网,使用谷歌邮箱或其他邮箱注册,点击“Try now”进入创作界面。
第二步,输入提示词。这一步直接决定生成质量,官方建议:细节越丰富越好,最好包含音乐流派、描述性短语、乐器、情绪、节拍等要素。例如:Cinematic, Soundtrack, Wild West, High Noon Shoot Out, Percussion, Whistles, Horses, Action Scene, SFX, Shaker, Guitar, Bass, Timpani, Strings, Tense, Climactic, Atmospheric, Moody。官方还提供了一份常见提示词指南,如果缺乏思路,可以点击“Prompt Library”——其中包含流行、古典摇滚、安静、鼓声独奏等18种类型。比如选择pop,系统会自动填入提示词:Machine, Bass, Lush Synthesizer Pads, Synthesizer Arp, Synth Bass, Vocal Sample Chops, Percussion, Honest, Heart-Felt, Melancholic, Vibe, Cool, Modern, Atmospheric, 115 BPM。
第三步,调整参数。首先选择模型(默认最新2.0版本),然后设定生成时长(最长3分钟),最后点击“Generate”即可生成。
除了文本生成音频,Stable Audio 2.0还支持音频到音频转换——上传一段音频,再输入提示词即可。例如,上传歌曲《若月亮没来》,将其改编成迪斯科风格,效果如何?一试便知。
是否免费
使用需借助网络环境(科学上网)。Stable Audio 2.0提供免费试用,新用户每月赠送20个积分,每生成一首三分钟音乐消耗2个积分。此外还有三种付费计划,生成的音频均可商用:专业版每月11.99美元(500积分),工作室版每月29.99美元(1350积分),最高版本每月89.99美元(4500积分)。
总结
从易用性来看,Stable Audio 2.0界面简洁直观,用户只需输入风格、乐器、情绪等描述,或上传一段音乐,即可快速获得成品。从创新性来看,它能生成长达三分钟的高质量音乐,结构完整——包含引子、发展、尾声,立体声效果出色。相比之下,Suno最长只能生成2分钟。更关键的是,Stable Audio 2.0支持商业化使用,这点极具吸引力。
从功能性来看,它还支持风格转换,能够修改新生成的或上传的音频。不过与Suno相比,Stable Audio 2.0生成的作品偶尔存在杂音明显、乐器音色冲突的问题。此外,Suno能自动生成歌词,而Stable Audio 2.0暂无此功能。综合来看,目前Stable Audio 2.0尚无法撼动Suno在AI音乐领域的“一哥”地位。
