Gemini TTS: Stimmen, Sprachen und Prompting-Leitfaden
·
Gemini TTS ist die neuronale Engine hinter den PREMIUM-Stimmen von Audiobook Maker. Dieser Leitfaden zeigt die verfügbaren Stimmen, die unterstützten Sprachen und wie Sie die Sprechweise mit Prompts steuern.
Stimmoptionen
30 unterschiedliche Stimmen, jede mit eigenem Charakter. Der Stimmname ist fest; der Deskriptor fasst den natürlichen Ton zusammen.
| Stimme | Charakter |
|---|---|
| Zephyr | Hell |
| Puck | Optimistisch |
| Charon | Informativ |
| Kore | Bestimmt |
| Fenrir | Erregbar |
| Leda | Jugendlich |
| Orus | Bestimmt |
| Aoede | Locker |
| Callirrhoe | Entspannt |
| Autonoe | Hell |
| Enceladus | Hauchig |
| Iapetus | Klar |
| Umbriel | Entspannt |
| Algieba | Geschmeidig |
| Despina | Geschmeidig |
| Erinome | Klar |
| Algenib | Rau |
| Rasalgethi | Informativ |
| Laomedeia | Optimistisch |
| Achernar | Sanft |
| Alnilam | Bestimmt |
| Schedar | Gleichmäßig |
| Gacrux | Reif |
| Pulcherrima | Direkt |
| Achird | Freundlich |
| Zubenelgenubi | Lässig |
| Vindemiatrix | Zart |
| Sadachbia | Lebhaft |
| Sadaltager | Sachkundig |
| Sulafat | Warm |
Unterstützte Sprachen
Gemini TTS unterstützt die folgenden Sprachen (BCP-47-Code in Klammern):
Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).
Prompting-Leitfaden
Das Modell leitet die Sprechweise automatisch aus dem Text ab. Mit Inline-Tags und strukturierten Anweisungen können Sie sie weiter steuern.
Inline-Audio-Tags
Inline-Modifikatoren wie [whispers], [laughs], [excitedly], [bored] und [shouting] verändern Ton, Tempo und emotionale Qualität. Seien Sie kreativ und experimentieren Sie mit verschiedenen Darbietungen.
Erweiterte Prompting-Elemente
- Audio Profile — Name und Rolle der Figur.
- Scene — Umgebungskontext, der Stimmung und Schauplatz festlegt.
- Director’s Notes — Regieanweisungen: Stil, Tempo, Akzent.
- Sample Context — kontextuelle Verankerung für einen natürlichen Einstieg in die Darbietung.
- Transcript — die genau gesprochenen Worte, zusammen mit den Audio-Tags.
Wichtige Hinweise
Sie müssen nicht alles beschreiben – dem Modell Spielraum zu lassen, fördert oft die Natürlichkeit. Wägen Sie Genauigkeit und kreative Freiheit ab und bevorzugen Sie Fachterminologie und nuancierte Eigenschaften gegenüber einfachen Gefühlsetiketten.
So verwenden Sie Prompts in Audiobook Maker
Audiobook Maker liest den Kapiteltext direkt vor, daher fügen Sie Prompt-Hinweise direkt in den Text ein – auf zwei Arten:
- Bearbeiten Sie die TXT-Eingabedatei vor dem Hochladen und fügen Sie Tags/Hinweise direkt in den Text ein.
- Oder laden Sie die erzeugte .ABM-Datei herunter, bearbeiten Sie die Kapiteltexte und laden Sie die geänderte .ABM erneut in Audiobook Maker hoch.
Quelle: Google AI — Speech generation
Try Audiobook Maker Free →