Gemini TTS:语音、语言与提示词指南

·

Gemini TTS 是 Audiobook Maker PREMIUM 语音背后的神经网络引擎。本指南介绍可用的语音、支持的语言,以及如何通过提示来控制朗读效果。

语音选项

30 种不同的语音,各具特色。语音名称固定不变;特征描述概括其自然音色。

语音特征
Zephyr明亮
Puck轻快
Charon信息丰富
Kore坚定
Fenrir易激动
Leda年轻
Orus坚定
Aoede轻松
Callirrhoe随和
Autonoe明亮
Enceladus气声
Iapetus清晰
Umbriel随和
Algieba流畅
Despina流畅
Erinome清晰
Algenib低沉沙哑
Rasalgethi信息丰富
Laomedeia轻快
Achernar柔和
Alnilam坚定
Schedar平稳
Gacrux成熟
Pulcherrima直接
Achird友好
Zubenelgenubi随意
Vindemiatrix温和
Sadachbia活泼
Sadaltager博学
Sulafat温暖

支持的语言

Gemini TTS 支持以下语言(括号内为 BCP-47 代码):

Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).

提示指南

模型会自动根据文本推断朗读方式。你可以通过内联标签和结构化指示进一步加以引导。

内联音频标签

诸如 [whispers][laughs][excitedly][bored][shouting] 等内联修饰符可改变语气、节奏和情感质感。请发挥创意,尝试不同的演绎方式。

高级提示要素

关键建议

不必事无巨细地描述——给模型留出发挥空间往往更显自然。在精确性与创作自由之间取得平衡,并优先使用行业术语和层次化的特征描述,而非简单的情绪标签。

如何在 Audiobook Maker 中使用提示

Audiobook Maker 会直接朗读章节文本,因此提示要写入文本本身,有两种方式:

来源:Google AI — Speech generation

Try Audiobook Maker Free →