Gemini TTS: voci, lingue e guida al prompting
·
Gemini TTS è il motore neurale dietro le Voci PREMIUM di Audiobook Maker. Questa guida illustra le voci disponibili, le lingue supportate e come guidare la lettura con i prompt.
Opzioni voce
30 voci distinte, ognuna con un proprio carattere. Il nome della voce è fisso; il descrittore ne riassume il tono naturale.
| Voce | Carattere |
|---|---|
| Zephyr | Brillante |
| Puck | Vivace |
| Charon | Informativo |
| Kore | Deciso |
| Fenrir | Entusiasta |
| Leda | Giovanile |
| Orus | Deciso |
| Aoede | Disinvolto |
| Callirrhoe | Rilassato |
| Autonoe | Brillante |
| Enceladus | Sussurrato |
| Iapetus | Chiaro |
| Umbriel | Rilassato |
| Algieba | Morbido |
| Despina | Morbido |
| Erinome | Chiaro |
| Algenib | Roco |
| Rasalgethi | Informativo |
| Laomedeia | Vivace |
| Achernar | Delicato |
| Alnilam | Deciso |
| Schedar | Equilibrato |
| Gacrux | Maturo |
| Pulcherrima | Diretto |
| Achird | Amichevole |
| Zubenelgenubi | Informale |
| Vindemiatrix | Gentile |
| Sadachbia | Brioso |
| Sadaltager | Competente |
| Sulafat | Caldo |
Lingue supportate
Gemini TTS supporta le seguenti lingue (codice BCP-47 fra parentesi):
Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).
Guida al prompting
Il modello deduce la lettura dal testo automaticamente. Puoi guidarla ulteriormente con tag inline e indicazioni strutturate.
Tag audio inline
Modificatori inline come [whispers], [laughs], [excitedly], [bored] e [shouting] cambiano tono, ritmo e qualità emotiva. Sii creativo e sperimenta variazioni di resa.
Elementi di prompting avanzato
- Audio Profile — nome e ruolo del personaggio.
- Scene — contesto ambientale che definisce atmosfera e ambientazione.
- Director’s Notes — indicazioni di resa: stile, ritmo, accento.
- Sample Context — aggancio contestuale per un ingresso naturale nella lettura.
- Transcript — le parole esatte da pronunciare, insieme ai tag audio.
Linee guida chiave
Non serve descrivere tutto: lasciare spazio al modello favorisce spesso la naturalezza. Bilancia specificità e libertà creativa e preferisci la terminologia di settore e caratteristiche stratificate alle semplici etichette emotive.
Come usare i prompt in Audiobook Maker
Audiobook Maker legge direttamente il testo dei capitoli, quindi i prompt si inseriscono nel testo stesso, in due modi:
- Modifica il file TXT in input prima del caricamento, inserendo tag/indicazioni direttamente nel testo.
- Oppure scarica il file .ABM generato, modifica i testi dei capitoli e ricarica l'.ABM modificato su Audiobook Maker.