Gemini TTS: voci, lingue e guida al prompting

·

Gemini TTS è il motore neurale dietro le Voci PREMIUM di Audiobook Maker. Questa guida illustra le voci disponibili, le lingue supportate e come guidare la lettura con i prompt.

Opzioni voce

30 voci distinte, ognuna con un proprio carattere. Il nome della voce è fisso; il descrittore ne riassume il tono naturale.

VoceCarattere
ZephyrBrillante
PuckVivace
CharonInformativo
KoreDeciso
FenrirEntusiasta
LedaGiovanile
OrusDeciso
AoedeDisinvolto
CallirrhoeRilassato
AutonoeBrillante
EnceladusSussurrato
IapetusChiaro
UmbrielRilassato
AlgiebaMorbido
DespinaMorbido
ErinomeChiaro
AlgenibRoco
RasalgethiInformativo
LaomedeiaVivace
AchernarDelicato
AlnilamDeciso
SchedarEquilibrato
GacruxMaturo
PulcherrimaDiretto
AchirdAmichevole
ZubenelgenubiInformale
VindemiatrixGentile
SadachbiaBrioso
SadaltagerCompetente
SulafatCaldo

Lingue supportate

Gemini TTS supporta le seguenti lingue (codice BCP-47 fra parentesi):

Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).

Guida al prompting

Il modello deduce la lettura dal testo automaticamente. Puoi guidarla ulteriormente con tag inline e indicazioni strutturate.

Tag audio inline

Modificatori inline come [whispers], [laughs], [excitedly], [bored] e [shouting] cambiano tono, ritmo e qualità emotiva. Sii creativo e sperimenta variazioni di resa.

Elementi di prompting avanzato

Linee guida chiave

Non serve descrivere tutto: lasciare spazio al modello favorisce spesso la naturalezza. Bilancia specificità e libertà creativa e preferisci la terminologia di settore e caratteristiche stratificate alle semplici etichette emotive.

Come usare i prompt in Audiobook Maker

Audiobook Maker legge direttamente il testo dei capitoli, quindi i prompt si inseriscono nel testo stesso, in due modi:

Fonte: Google AI — Speech generation

Try Audiobook Maker Free →