Hoe werken stemklonen en stemimitatie met de VOCALIS AI Agent?
Stembibliotheek, aangepaste klonering en geavanceerde steminstellingen.
De stem van uw agent is zijn of haar kenmerkende stemgeluid. Kies uit een uitgebreide bibliotheek met professionele stemmen, of creëer een eigen stem op basis van een opname.
Drie opties beschikbaar
1. Bibliotheek met bestaande stemmen
Krijg toegang tot een ruime selectie hoogwaardige, vooraf getrainde stemmen via ElevenLabs en Cartesia. Elke stem is beschikbaar in verschillende intonaties: formeel, informeel, warm, gezaghebbend, enz
2. Stemklonen op maat
Creëer een synthetische stem die klinkt alsof een echt persoon spreekt. De gekloonde stem kan worden gebruikt in Pipeline- en Dualplex-modi.
| Leverancier | Vereisten voor klonen |
|---|---|
| Cartesia | Eén audiobestand, minimaal 10 seconden, slechts één spreker, zonder achtergrondgeluid |
| ElevenLabs | Diverse samples, in totaal meer dan een minuut, van één spreker, zonder achtergrondgeluid |
3. Cartesia Voice Sonic 3 (Nieuw)
De Cartesia Sonic 3 TTS-engine levert hoogwaardige audiokwaliteit met geavanceerde emotiecontrole. Het ondersteunt stemklonen en SAML-tags om toonhoogte, intensiteit en expressiviteit in realtime aan te passen.
Geavanceerde spraakinstellingen
| Instelling | Strand | Effect |
|---|---|---|
| Temperatuur | 0.0 – 1.0 | Een lagere toonhoogte = een stabiele maar minder expressieve stem. Een hogere toonhoogte = een dynamischere en creatievere stem. |
| Een moment van stilte voordat je ophangt | 30-45 seconden | Wachttijd als de andere partij niet opneemt voordat het gesprek wordt beëindigd. |
| Maximale gespreksduur | 20 – 1200 sec | Een absolute limiet op de duur van een gesprek om de kosten te beheersen. |
