Gemini TTS : voix, langues et guide de prompting
·
Gemini TTS est le moteur neuronal des voix PREMIUM d'Audiobook Maker. Ce guide présente les voix disponibles, les langues prises en charge et comment orienter la lecture à l'aide de prompts.
Options de voix
30 voix distinctes, chacune avec son propre caractère. Le nom de la voix est fixe ; le descripteur résume son ton naturel.
| Voix | Caractère |
|---|---|
| Zephyr | Lumineux |
| Puck | Enjoué |
| Charon | Informatif |
| Kore | Ferme |
| Fenrir | Exalté |
| Leda | Jeune |
| Orus | Ferme |
| Aoede | Désinvolte |
| Callirrhoe | Décontracté |
| Autonoe | Lumineux |
| Enceladus | Soufflé |
| Iapetus | Clair |
| Umbriel | Décontracté |
| Algieba | Doux |
| Despina | Doux |
| Erinome | Clair |
| Algenib | Rocailleux |
| Rasalgethi | Informatif |
| Laomedeia | Enjoué |
| Achernar | Tendre |
| Alnilam | Ferme |
| Schedar | Égal |
| Gacrux | Mûr |
| Pulcherrima | Direct |
| Achird | Amical |
| Zubenelgenubi | Détendu |
| Vindemiatrix | Délicat |
| Sadachbia | Vif |
| Sadaltager | Savant |
| Sulafat | Chaleureux |
Langues prises en charge
Gemini TTS prend en charge les langues suivantes (code BCP-47 entre parenthèses) :
Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).
Guide de prompting
Le modèle déduit automatiquement la lecture à partir du texte. Vous pouvez l'orienter davantage avec des balises en ligne et des indications structurées.
Balises audio en ligne
Des modificateurs en ligne comme [whispers], [laughs], [excitedly], [bored] et [shouting] modifient le ton, le rythme et la qualité émotionnelle. Soyez créatif et expérimentez différentes interprétations.
Éléments de prompting avancés
- Audio Profile — nom et rôle du personnage.
- Scene — contexte environnemental qui définit l'ambiance et le décor.
- Director’s Notes — indications de jeu : style, rythme, accent.
- Sample Context — ancrage contextuel pour une entrée naturelle dans l'interprétation.
- Transcript — les mots exacts à prononcer, accompagnés des balises audio.
Conseils clés
Inutile de tout décrire : laisser de la marge au modèle favorise souvent le naturel. Équilibrez précision et liberté créative, et préférez la terminologie du métier et des caractéristiques nuancées aux simples étiquettes émotionnelles.
Comment utiliser les prompts dans Audiobook Maker
Audiobook Maker lit directement le texte des chapitres ; vous insérez donc les indications de prompt dans le texte lui-même, de deux façons :
- Modifiez le fichier TXT d'entrée avant le téléversement, en insérant les balises/indications directement dans le texte.
- Ou téléchargez le fichier .ABM généré, modifiez les textes des chapitres et téléversez à nouveau le .ABM modifié sur Audiobook Maker.
Source: Google AI — Speech generation
Try Audiobook Maker Free →