Gemini TTS:语音、语言与提示词指南
·
Gemini TTS 是 Audiobook Maker PREMIUM 语音背后的神经网络引擎。本指南介绍可用的语音、支持的语言,以及如何通过提示来控制朗读效果。
语音选项
30 种不同的语音,各具特色。语音名称固定不变;特征描述概括其自然音色。
| 语音 | 特征 |
|---|---|
| Zephyr | 明亮 |
| Puck | 轻快 |
| Charon | 信息丰富 |
| Kore | 坚定 |
| Fenrir | 易激动 |
| Leda | 年轻 |
| Orus | 坚定 |
| Aoede | 轻松 |
| Callirrhoe | 随和 |
| Autonoe | 明亮 |
| Enceladus | 气声 |
| Iapetus | 清晰 |
| Umbriel | 随和 |
| Algieba | 流畅 |
| Despina | 流畅 |
| Erinome | 清晰 |
| Algenib | 低沉沙哑 |
| Rasalgethi | 信息丰富 |
| Laomedeia | 轻快 |
| Achernar | 柔和 |
| Alnilam | 坚定 |
| Schedar | 平稳 |
| Gacrux | 成熟 |
| Pulcherrima | 直接 |
| Achird | 友好 |
| Zubenelgenubi | 随意 |
| Vindemiatrix | 温和 |
| Sadachbia | 活泼 |
| Sadaltager | 博学 |
| Sulafat | 温暖 |
支持的语言
Gemini TTS 支持以下语言(括号内为 BCP-47 代码):
Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).
提示指南
模型会自动根据文本推断朗读方式。你可以通过内联标签和结构化指示进一步加以引导。
内联音频标签
诸如 [whispers]、[laughs]、[excitedly]、[bored] 和 [shouting] 等内联修饰符可改变语气、节奏和情感质感。请发挥创意,尝试不同的演绎方式。
高级提示要素
- Audio Profile — 角色名称与身份设定。
- Scene — 营造氛围和场景的环境背景。
- Director’s Notes — 表演指导:风格、节奏、口音。
- Sample Context — 为自然进入表演提供的上下文铺垫。
- Transcript — 需要朗读的确切文字,并配以音频标签。
关键建议
不必事无巨细地描述——给模型留出发挥空间往往更显自然。在精确性与创作自由之间取得平衡,并优先使用行业术语和层次化的特征描述,而非简单的情绪标签。
如何在 Audiobook Maker 中使用提示
Audiobook Maker 会直接朗读章节文本,因此提示要写入文本本身,有两种方式:
- 在上传前编辑输入的 TXT 文件,直接在文本中插入标签/指示。
- 或下载生成的 .ABM 文件,编辑各章节文本,再将修改后的 .ABM 重新上传到 Audiobook Maker。