Gemini TTS：语音、语言与提示词指南

发布于: 2026-06-09 · 最后更新: 2026-06-11

Gemini TTS 是 Audiobook Maker PREMIUM 语音背后的神经网络引擎。本指南介绍可用的语音、支持的语言，以及如何通过提示来控制朗读效果。

语音选项

30 种不同的语音，各具特色。语音名称固定不变；特征描述概括其自然音色。

语音	特征
Zephyr	明亮
Puck	轻快
Charon	信息丰富
Kore	坚定
Fenrir	易激动
Leda	年轻
Orus	坚定
Aoede	轻松
Callirrhoe	随和
Autonoe	明亮
Enceladus	气声
Iapetus	清晰
Umbriel	随和
Algieba	流畅
Despina	流畅
Erinome	清晰
Algenib	低沉沙哑
Rasalgethi	信息丰富
Laomedeia	轻快
Achernar	柔和
Alnilam	坚定
Schedar	平稳
Gacrux	成熟
Pulcherrima	直接
Achird	友好
Zubenelgenubi	随意
Vindemiatrix	温和
Sadachbia	活泼
Sadaltager	博学
Sulafat	温暖

支持的语言

Gemini TTS 支持以下语言（括号内为 BCP-47 代码）：

Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).

提示指南

模型会自动根据文本推断朗读方式。你可以通过内联标签和结构化指示进一步加以引导。

内联音频标签

诸如 [whispers]、[laughs]、[excitedly]、[bored] 和 [shouting] 等内联修饰符可改变语气、节奏和情感质感。请发挥创意，尝试不同的演绎方式。

高级提示要素

Audio Profile — 角色名称与身份设定。
Scene — 营造氛围和场景的环境背景。
Director’s Notes — 表演指导：风格、节奏、口音。
Sample Context — 为自然进入表演提供的上下文铺垫。
Transcript — 需要朗读的确切文字，并配以音频标签。

关键建议

不必事无巨细地描述——给模型留出发挥空间往往更显自然。在精确性与创作自由之间取得平衡，并优先使用行业术语和层次化的特征描述，而非简单的情绪标签。

如何在 Audiobook Maker 中使用提示

Audiobook Maker 会直接朗读章节文本，因此提示要写入文本本身，有两种方式：

在上传前编辑输入的 TXT 文件，直接在文本中插入标签/指示。
或下载生成的 .ABM 文件，编辑各章节文本，再将修改后的 .ABM 重新上传到 Audiobook Maker。

来源：Google AI — Speech generation

Try Audiobook Maker Free →