Chaque assistant peut fonctionner dans l’un des trois modes vocaux. Le choix du mode détermine comment la parole de l’interlocuteur est analysée et comment la réponse est générée.

Les trois modes vocaux

🔄 Pipeline

Transcription → LLM → Synthèse vocale. Approche classique avec contrôle total.

Points forts : toutes les voix disponibles (y compris clonées), réponses longues et structurées, injection de variables.

Idéal pour : support client, explications détaillées, prompts complexes.

⚡ Speech-to-Speech

L’IA écoute et répond vocalement de façon directe, sans texte intermédiaire.

Points forts : latence ultra-faible, fluidité maximale, intonations naturelles.

Idéal pour : confirmations rapides, appels de vente dynamiques, échanges courts.

💡

Pour sélectionner un mode, rendez-vous dans Assistant → Paramètres → Moteur vocal. Testez les trois modes pour identifier le meilleur équilibre vitesse/qualité selon votre usage.