谷歌发布Gemini-TTS模型支持近70种语言可控语音生成

时间：2026-04-22 14:25

2026年4月，谷歌推出全新文本转语音模型Gemini-TTS 2026年4月，谷歌在其Gemini 3 1模型系列中，正式发布了全新的文本转语音模型——Gemini-TTS。官方将其定位为“迄今为止最具表现力的文本转语音解决方案”。该模型的显著优势在于，它支持通过自然语言指令来精细调节语音的情感、

2026年4月，谷歌推出全新文本转语音模型Gemini-TTS

2026年4月，谷歌在其Gemini 3.1模型系列中，正式发布了全新的文本转语音模型——Gemini-TTS。官方将其定位为“迄今为止最具表现力的文本转语音解决方案”。该模型的显著优势在于，它支持通过自然语言指令来精细调节语音的情感、节奏与风格，并覆盖了近70种语言。更便捷的是，它能自动识别输入文本的语言种类，无需开发者手动标注，这显著降低了构建全球化多语种语音服务的门槛。

传统TTS的痛点：表现力不足与定制成本高昂

回顾传统文本转语音技术，其长期面临的核心挑战在于：生成的语音往往缺乏变化。语调平淡、节奏刻板、情感表现力薄弱，难以满足有声读物、多角色对话、品牌宣传等对表现力要求较高的复杂应用场景。以往，开发者若想调整语音风格，通常需要预先录制大量特定音色的样本数据，再进行定制化模型训练，无论在时间周期还是资金投入方面，成本都相当高。

核心突破：通过提示词赋予开发者精准控制能力

那么，Gemini-TTS带来了哪些根本性的改变？其最核心的突破，在于将语音风格定制的控制权真正交还给了开发者。现在，无需进行任何额外的模型训练，仅需输入一段简单的自然语言提示词，就能精确调控输出语音的各项参数。例如，旁白需要低沉而庄重，对话需要轻松且自然，甚至具体到语句间的停顿、特定词汇的情感强调，都可以通过文字描述来实现。这使得生成语音的自然流畅度与情感细腻度，相比前代产品实现了显著提升。

多语言适配：一套方案满足全球化业务需求

除了在表现力上的升级，Gemini-TTS在多语言适配方面的能力，也精准应对了当前企业全球化运营的迫切需求。目前，该模型已支持近70种语言，中文普通话、英语、西班牙语、日语等全球主流语言全部涵盖。更为关键的是其内置的自动语言识别功能——开发者无需为输入文本手动指定语言，模型即可直接生成对应语言的标准语音输出。

这对于需要服务全球用户的企业而言，意味着什么？简而言之，就是只需接入一套统一的API，就能应对不同区域市场的多语种语音生成需求。无需再为每种语言寻找不同的技术供应商或解决方案，这在技术开发与后期运维层面，能够大幅降低复杂性与成本，提升整体效率。

行业趋势：生成式AI重新定义语音交互体验标准

显而易见，生成式AI技术的普及，正在深刻重塑语音交互的体验标准。用户对AI语音的期待，早已从基础的“清晰可辨”，升级为“优美动听、契合场景”。市场对于能够灵活定制、富有情感表现力的TTS解决方案的需求，正在迅猛增长。

Gemini-TTS将提示词控制这一创新思路引入文本转语音领域，为低门槛的语音个性化定制开辟了一条新路径。行业观察者普遍认为，这种灵活、可控的生成式范式，很可能将成为未来TTS模型发展的主流方向，并进一步推动AI语音技术在更广泛的消费级与企业级应用场景中落地与深化。

来源：https://cxgn.cn/12787.html

文本转语音

上一篇谷歌发布原生macOS版Gemini应用加码桌面AI赛道竞争 下一篇欧盟初步裁定Meta垄断要求WhatsApp开放第三方AI接入

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-01

诺基亚TA-1619入网：1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息，一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可，不过证件照目前还没公布。从入网信息来看，这是一款TD-LTE数字移动电话机，支持TD-LTE网络，属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持，终端款式为直板。核心配置方面，电池额定容

业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片，采用直接变频架构，覆盖10MHz至7250MHz频段，支持最大450MHz带宽及JESD204B高速接口，性能对标国际，满足5G基站与卫星通信等高端需求，突破海外技术壁垒。

业界动态 · 2026-07-01

月起私人充电桩可卖电每度净赚5毛

近期有一则重大利好消息，值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起，湖北武汉的新能源车主，可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言，就是借助峰谷电价差，实现低买高卖，每度电净收益约5毛钱。过去，车网互动（V2G）基本只局限于特定的公共充电站，受试点规模限制，

业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息：谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息，Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发，实际上它的技术代号是Gemini 3 1 Flash Lite Image，属于Gemini 3 1家族。最大的卖点就两个：快，便

业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行，来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴，以主板、显示器等专业硬件保障比赛稳定流畅，并通过赛事反哺研发的闭环模式支持电竞发展。