¿Cómo funciona la clonación y el procesamiento de voz con el agente de inteligencia artificial de VOCALIS?
Biblioteca de voces, clonación personalizada y configuraciones de voz avanzadas.
La voz de tu agente es su identidad sonora. Elige entre una amplia biblioteca de voces profesionales o crea una voz personalizada a partir de una grabación.
Tres opciones disponibles
1. Biblioteca de voces existentes
Accede a una amplia selección de voces preentrenadas de alta calidad a través de ElevenLabs y Cartesia. Cada voz está disponible en varios tonos: formal, informal, cálido, autoritario…
2. Clonación de voz personalizada
Crea una voz sintética que suene como una persona real hablando. La voz clonada se puede usar en los modos Pipeline y Dualplex.
| Proveedor | Requisitos para la clonación |
|---|---|
| Cartesia | Un solo archivo de audio, mínimo 10 segundos, solo un hablante, sin ruido de fondo |
| OnceLabs | Varias muestras, más de un minuto en total, un solo altavoz, sin ruido de fondo |
3. Cartesia Voice Sonic 3 (Nuevo)
El motor TTS de Cartesia Sonic 3 ofrece una calidad de audio de alta fidelidad con control avanzado de emociones. Admite clonación de voz y etiquetas SAML para ajustar el tono, la intensidad y la expresividad en tiempo real.
Configuración de voz avanzada
| Configuración | Playa | Efecto |
|---|---|---|
| Temperatura | 0.0 – 1.0 | Un tono más bajo = voz estable pero menos expresiva. Un tono más alto = voz más dinámica y creativa. |
| Periodo de silencio antes de colgar | 30-45 segundos | Tiempo de espera si la otra parte no contesta antes de finalizar la llamada. |
| Duración máxima de la llamada | 20 – 1200 segundos | Límite absoluto en la duración de una llamada para controlar costos. |
