Gemini TTS : voix, langues et guide de prompting

·

Gemini TTS est le moteur neuronal des voix PREMIUM d'Audiobook Maker. Ce guide présente les voix disponibles, les langues prises en charge et comment orienter la lecture à l'aide de prompts.

Options de voix

30 voix distinctes, chacune avec son propre caractère. Le nom de la voix est fixe ; le descripteur résume son ton naturel.

VoixCaractère
ZephyrLumineux
PuckEnjoué
CharonInformatif
KoreFerme
FenrirExalté
LedaJeune
OrusFerme
AoedeDésinvolte
CallirrhoeDécontracté
AutonoeLumineux
EnceladusSoufflé
IapetusClair
UmbrielDécontracté
AlgiebaDoux
DespinaDoux
ErinomeClair
AlgenibRocailleux
RasalgethiInformatif
LaomedeiaEnjoué
AchernarTendre
AlnilamFerme
SchedarÉgal
GacruxMûr
PulcherrimaDirect
AchirdAmical
ZubenelgenubiDétendu
VindemiatrixDélicat
SadachbiaVif
SadaltagerSavant
SulafatChaleureux

Langues prises en charge

Gemini TTS prend en charge les langues suivantes (code BCP-47 entre parenthèses) :

Arabic (ar), Filipino (fil), Bangla (bn), Finnish (fi), Dutch (nl), Galician (gl), English (en), Georgian (ka), French (fr), Greek (el), German (de), Gujarati (gu), Hindi (hi), Haitian Creole (ht), Indonesian (id), Hebrew (he), Italian (it), Hungarian (hu), Japanese (ja), Icelandic (is), Korean (ko), Javanese (jv), Marathi (mr), Kannada (kn), Polish (pl), Konkani (kok), Portuguese (pt), Romanian (ro), Russian (ru), Spanish (es), Tamil (ta), Telugu (te), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi), Afrikaans (af), Albanian (sq), Amharic (am), Armenian (hy), Azerbaijani (az), Basque (eu), Belarusian (be), Bulgarian (bg), Burmese (my), Catalan (ca), Cebuano (ceb), Chinese Mandarin (cmn), Croatian (hr), Czech (cs), Danish (da), Estonian (et), Latvian (lv), Lithuanian (lt), Luxembourgish (lb), Macedonian (mk), Maithili (mai), Malagasy (mg), Malay (ms), Malayalam (ml), Mongolian (mn), Nepali (ne), Norwegian Bokmål (nb), Norwegian Nynorsk (nn), Odia (or), Pashto (ps), Persian (fa), Punjabi (pa), Serbian (sr), Sindhi (sd), Sinhala (si), Slovak (sk), Slovenian (sl), Swahili (sw), Swedish (sv), Urdu (ur).

Guide de prompting

Le modèle déduit automatiquement la lecture à partir du texte. Vous pouvez l'orienter davantage avec des balises en ligne et des indications structurées.

Balises audio en ligne

Des modificateurs en ligne comme [whispers], [laughs], [excitedly], [bored] et [shouting] modifient le ton, le rythme et la qualité émotionnelle. Soyez créatif et expérimentez différentes interprétations.

Éléments de prompting avancés

Conseils clés

Inutile de tout décrire : laisser de la marge au modèle favorise souvent le naturel. Équilibrez précision et liberté créative, et préférez la terminologie du métier et des caractéristiques nuancées aux simples étiquettes émotionnelles.

Comment utiliser les prompts dans Audiobook Maker

Audiobook Maker lit directement le texte des chapitres ; vous insérez donc les indications de prompt dans le texte lui-même, de deux façons :

Source: Google AI — Speech generation

Try Audiobook Maker Free →