AI-assistenter
Hur fungerar röstkloning och röstbehandling med VOCALIS AI-agent?
Röstbibliotek, anpassad kloning och avancerade röstinställningar.
Din agents röst är deras ljudidentitet. Välj från ett omfattande bibliotek med professionella röster eller skapa en anpassad röst från en inspelning.
Tre alternativ tillgängliga
1. Bibliotek med befintliga röster
Få tillgång till ett brett urval av högkvalitativa, förtränade röster via ElevenLabs och Cartesia. Varje röst finns i flera olika toner: formell, avslappnad, varm, auktoritativ…
2. Anpassad röstkloning
Skapa en syntetisk röst som låter som en riktig person som talar. Den klonade rösten kan användas i Pipeline- och Dualplex-lägen.
| Leverantör | Krav för kloning |
|---|---|
| Cartesia | En enda ljudfil, minst 10 sekunder, endast en talare, utan bakgrundsljud |
| ElevenLabs | Flera samplingar, mer än en minut totalt, en enda högtalare, utan bakgrundsbrus |
3. Cartesia Voice Sonic 3 (Nytt)
Cartesia Sonic 3 TTS-motorn levererar högkvalitativ ljudkvalitet med avancerad känslokontroll. Den stöder röstkloning och SAML-taggar för att justera tonhöjd, intensitet och uttrycksfullhet i realtid.
Avancerade röstinställningar
| Miljö | Strand | Effekt |
|---|---|---|
| Temperatur | 0.0 – 1.0 | Lägre tonhöjd = stabil men mindre uttrycksfull röst. Högre tonhöjd = mer dynamisk och kreativ röst. |
| Tystnadsperiod innan luren läggs på | 30–45 sekunder | Väntetid om den andra parten inte svarar innan samtalet avslutas. |
| Maximal samtalslängd | 20–1200 sekunder | Absolut gräns för samtalslängden för att kontrollera kostnaderna. |
