Como funcionam a clonagem e o processamento de voz com o agente de IA VOCALIS?
Biblioteca de vozes, clonagem personalizada e configurações avançadas de voz.
A voz do seu agente é a sua identidade sonora. Escolha entre uma extensa biblioteca de vozes profissionais ou crie uma voz personalizada a partir de uma gravação.
Três opções disponíveis
1. Biblioteca de vozes existentes
Acesse uma ampla seleção de vozes pré-treinadas de alta qualidade através da ElevenLabs e da Cartesia. Cada voz está disponível em diversos tons: formal, informal, caloroso, autoritário…
2. Clonagem de Voz Personalizada
Crie uma voz sintética que soe como uma pessoa real falando. A voz clonada pode ser usada nos modos Pipeline e Dualplex.
| Fornecedor | Requisitos para clonagem |
|---|---|
| Cartesia | Um único arquivo de áudio, com duração mínima de 10 segundos, gravado por apenas uma pessoa, sem ruído de fundo |
| OnzeLabs | Diversas amostras, mais de um minuto no total, um único orador, sem ruído de fundo |
3. Cartesia Voice Sonic 3 (Novo)
O mecanismo de síntese de voz Cartesia Sonic 3 oferece áudio de alta fidelidade com controle avançado de emoções. Ele suporta clonagem de voz e tags SAML para ajustar tom, intensidade e expressividade em tempo real.
Configurações avançadas de voz
| Contexto | Praia | Efeito |
|---|---|---|
| Temperatura | 0.0 – 1.0 | Tom mais grave = voz estável, porém menos expressiva. Tom mais agudo = voz mais dinâmica e criativa. |
| Período de silêncio antes de desligar | 30-45 segundos | Tempo de espera caso a outra parte não atenda antes de encerrar a chamada. |
| Duração máxima da chamada | 20 – 1200 segundos | Limite absoluto na duração de uma chamada para controlar custos. |
