Gemini TTS: Stimmen, Sprachen und Prompting-Leitfaden

·

Gemini TTS ist die neuronale Engine hinter den PREMIUM-Stimmen von Audiobook Maker. Dieser Leitfaden zeigt die verfügbaren Stimmen, die unterstützten Sprachen und wie Sie die Sprechweise mit Prompts steuern.

Stimmoptionen

30 unterschiedliche Stimmen, jede mit eigenem Charakter. Der Stimmname ist fest; der Deskriptor fasst den natürlichen Ton zusammen.

StimmeCharakter
ZephyrHell
PuckOptimistisch
CharonInformativ
KoreBestimmt
FenrirErregbar
LedaJugendlich
OrusBestimmt
AoedeLocker
CallirrhoeEntspannt
AutonoeHell
EnceladusHauchig
IapetusKlar
UmbrielEntspannt
AlgiebaGeschmeidig
DespinaGeschmeidig
ErinomeKlar
AlgenibRau
RasalgethiInformativ
LaomedeiaOptimistisch
AchernarSanft
AlnilamBestimmt
SchedarGleichmäßig
GacruxReif
PulcherrimaDirekt
AchirdFreundlich
ZubenelgenubiLässig
VindemiatrixZart
SadachbiaLebhaft
SadaltagerSachkundig
SulafatWarm

Unterstützte Sprachen

Gemini TTS unterstützt die folgenden Sprachen (BCP-47-Code in Klammern):

Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).

Prompting-Leitfaden

Das Modell leitet die Sprechweise automatisch aus dem Text ab. Mit Inline-Tags und strukturierten Anweisungen können Sie sie weiter steuern.

Inline-Audio-Tags

Inline-Modifikatoren wie [whispers], [laughs], [excitedly], [bored] und [shouting] verändern Ton, Tempo und emotionale Qualität. Seien Sie kreativ und experimentieren Sie mit verschiedenen Darbietungen.

Erweiterte Prompting-Elemente

Wichtige Hinweise

Sie müssen nicht alles beschreiben – dem Modell Spielraum zu lassen, fördert oft die Natürlichkeit. Wägen Sie Genauigkeit und kreative Freiheit ab und bevorzugen Sie Fachterminologie und nuancierte Eigenschaften gegenüber einfachen Gefühlsetiketten.

So verwenden Sie Prompts in Audiobook Maker

Audiobook Maker liest den Kapiteltext direkt vor, daher fügen Sie Prompt-Hinweise direkt in den Text ein – auf zwei Arten:

Quelle: Google AI — Speech generation

Try Audiobook Maker Free →