谷歌Gemini上线AI音乐创作功能,挑战Suno

新智元报道
编辑:艾伦
【新智元导读】谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。
昨天,谷歌在 Gemini App 中上线了 AI 音乐生成功能。

用户输入一段文字描述,或者上传一张照片,几秒钟内就能得到一首 30 秒的完整歌曲,带人声、带歌词、带 AI 生成的封面。纯器乐当然也是支持的。
驱动这个功能的是 DeepMind 最新的音乐生成模型 Lyria 3。

谷歌对这项功能的定位,不是取代音乐人,而是让普通人获得一种全新的自我表达方式。
做 AI 音乐生成的公司不少,但把它直接塞进一个拥有超过 7.5 亿月活用户的超级应用里,谷歌是头一个。
「30 秒」背后的技术跃迁
从 2024 年发布初代 Lyria 算起,这已经是谷歌在音乐生成领域的第三代模型。
相比前代,Lyria 3 有几个明显的进步。
过去用户需要自己写歌词输入模型,现在 Lyria 3 可以根据提示词自动生成歌词。
用户对风格、人声类型、节拍速度等元素的控制也更精细了。
根据 DeepMind 最新推文,Lyria 3 输出 48kHz 立体声音频,人声表现更自然,歌词的咬字清晰度也有了明显提升。
据数字音乐媒体 Digital Music News 报道,Lyria 3 的训练数据规模从 Lyria 2 的约 50 万首曲目扩展到了超过 200 万首,音频位深从此前版本升级到了 24-bit。
这意味着它在音质维度上甚至超过了 YouTube Music 等主流流媒体平台的标准。
除了文本生成音乐,用户还可以上传照片或视频,让 Gemini 根据视觉内容的情绪来作曲配词。
比如上传一张徒步的照片,Gemini 就能创作一首与之匹配的歌曲。
封面则由谷歌的图像生成模型 Nano Banana 自动完成。
功能目前以 Beta 形式向全球 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,桌面端已率先上线,移动端将在未来几天内陆续推送。
谷歌 AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。
与此同时,Lyria 3 也被整合进了 YouTube 的 Dream Track 功能,帮助创作者为 Shorts 短视频生成背景音乐。这项功能此前仅限美国地区,此次正式面向全球创作者开放。
版权这张牌
谷歌打得很小心
AI 音乐生成领域的版权纠纷从未停歇。
2024 年夏天,环球音乐、索尼音乐和华纳音乐联手对 AI 音乐初创公司 Suno 和 Udio 提起了总金额达 5 亿美元的版权侵权诉讼。
到 2025 年底,Suno 与华纳达成和解并获得授权,Udio 也分别与环球和华纳签署了协议。
整个行业正在从对抗走向合作,但紧张关系远未消散。
在这个背景下,谷歌的措辞格外谨慎。
最新公告强调 Lyria 3 的设计目标是「原创表达,而非模仿现有艺术家」。
如果用户在提示词中提到某位具体艺术家的名字,Gemini 只会将其作为宽泛的创作灵感,生成风格或情绪相似的作品,而非模仿该艺术家的声音。
谷歌还表示在训练过程中「非常注意版权和合作伙伴协议」,并设置了过滤器来比对输出内容与已有作品。
在内容标识层面,所有通过 Gemini 生成的音乐都会嵌入 SynthID 水印。
更值得关注的是,Gemini 现在还新增了音频鉴别功能——用户可以上传一段音频文件,询问它是否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推理给出判断。
这是继图片和视频鉴别之后,SynthID 覆盖的第三种媒体类型。
当音乐生成变成一场平台战争
如果说 Suno 和 Udio 代表了 AI 音乐的创业浪潮,谷歌此举则标志着这场竞赛正式升级为平台级别的角力。
Suno 在 2024 年 11 月完成了 2.5 亿美元融资,其付费版本已经提供了虚拟音频工作站等专业编辑功能。
但 Suno 的月活用户量级与 Gemini 的 7.5 亿相比,根本不在同一个数量级。
Tom's Guide 的编辑在体验后写道,她把丈夫的待办事项清单变成了一首朋克摇滚歌曲,然后通过短信发了出去。
这种场景可能正是谷歌想要的:音乐生成的杀手级应用也许并不在录音棚里,而是藏在日常生活的每一条消息、每一次分享中。
30 秒的长度限制、Beta 阶段的粗糙感、版权争议的暗涌——Lyria 3 显然还远谈不上完美。
但谷歌选择在这个时间点把它推向 7.5 亿用户面前,传递的信号已经足够清晰:AI 音乐生成这件事,它不打算再等了。
当每个人的口袋里都装着一个作曲家的时候,改变的或许不是音乐本身,而是我们与音乐之间的关系。
参考资料:
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/
https://x.com/GoogleDeepMind/status/2024153067654902014
相关攻略
想让你的统信UOS开机时响起自己心仪的旋律吗?其实,替换默认的开机音乐并不复杂,核心操作就是替换系统预置的一个音效文件。下面,我们就来详细拆解几种实现方法,从图形界面到命令行,总有一款适合你。 一、图形界面方式替换开机音乐 对于不习惯使用命令行的用户,通过文件管理器进行可视化操作是最直观的选择。整个
通义万相:五种高效生成专业专辑封面的实战方法 为音乐作品打造一张兼具专业质感与风格统一性的专辑封面,如今已不再是设计师的专属。即便你毫无平面设计经验,手边也没有复杂的图像处理工具,借助通义万相的多模态图像生成能力,也能轻松跨越从0到1的创作门槛。下面这五种方法,都是可以直接落地操作的实战技巧。 ☞☞
Apple Music已下载歌曲可设为铃声或提示音:需确认本地下载完成→在全屏播放页尝试“设为铃声”→失败时用库乐队导入裁剪→或用于闹钟 计时器提示音。 想把 Apple Music 里那首单曲循环的歌设成专属铃声?这个想法很自然,但得先摸清苹果的规则。由于版权保护,流媒体歌曲不能直接导出,不过,如
苹果控制中心音乐卡片怎么设置_苹果控制中心音乐卡片显示设置【教程】 想在 iPhone 的控制中心里快速瞥一眼正在播放的歌,或者顺手切个曲?如果发现那个方便的音乐卡片不见了踪影,问题很可能出在控制中心的设置上——音乐识别或播放控件可能压根就没被添加进去。别急,跟着下面这几步走,就能把它找回来。 一、
麒麟系统怎么设置开机音乐和系统提示音 想让你的麒麟操作系统(Kylin OS)开机和提示音与众不同?其实,通过系统设置或者手动替换音频文件,完全可以实现个性化定制。下面这几种方法,总有一款适合你。 一、通过系统设置配置开机音乐 在麒麟系统部分版本(比如V10 SP1及后续更新版)中,“声音设置”里确
热门专题
热门推荐
为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘
Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,
劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲
新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。
当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID





