Chaque assistant peut fonctionner dans l’un des trois modes vocaux. Le choix du mode détermine comment la parole de l’interlocuteur est analysée et comment la réponse est générée.

🔄 Pipeline

Transcription → LLM → Synthèse vocale. Approche classique avec contrôle total.

Points forts : toutes les voix disponibles (y compris clonées), réponses longues et structurées, injection de variables.

Idéal pour : support client, explications détaillées, prompts complexes.

⚡ Speech-to-Speech

L’IA écoute et répond vocalement de façon directe, sans texte intermédiaire.

Points forts : latence ultra-faible, fluidité maximale, intonations naturelles.

Idéal pour : confirmations rapides, appels de vente dynamiques, échanges courts.

💡

Pour sélectionner un mode, rendez-vous dans Assistant → Paramètres → Moteur vocal. Testez les trois modes pour identifier le meilleur équilibre vitesse/qualité selon votre usage.