So funktioniert
Der komplette Ablauf eines KI-Anrufs – von der Spracherkennung bis zur Antwortsynthese.
Vocalis.pro- Plattform kombiniert KI-Spracherkennung und LLM-basierte Antwortgenerierung für Telefongespräche in Echtzeit. Hier der vereinfachte Ablauf:
für eingehende oder ausgehende
Echtzeit-Erkennung und -Transkription
Entscheidungssystem
Natürliche Reaktion
Transkriptbericht & Ergebnisse
Einzelheiten zu jedem Schritt
1. Initiierung des Anrufs
Eingehend: Ein Kunde wählt Ihre zugewiesene Nummer, und der KI-Agent nimmt den Anruf sofort entgegen. Ausgehend: Die Plattform wählt anhand der definierten Parameter eine Liste von Nummern aus Ihrer Kampagne.
2. Spracherkennung
Die KI hört kontinuierlich zu, was der Sprecher sagt, und transkribiert seine Worte in Echtzeit mit optimaler Genauigkeit in Text.
3. LLM-Modellentscheidung
Das große Sprachmodell analysiert die Transkription und Ihr Ansagesystem, um die am besten geeignete Antwort zu formulieren oder eine Aktion auszulösen (Weiterleitung, Terminvereinbarung, Beendigung des Gesprächs usw.).
4. Sprachsynthese
Die Textantwort wird mithilfe hochwertiger TTS-Systeme (ElevenLabs, Cartesia) in natürliche Sprache umgewandelt. Die Stimme kann aus einer umfangreichen Bibliothek ausgewählt oder von einer Audioaufnahme kopiert werden.
5. Daten & Berichterstattung
Am Ende jedes Anrufs erhalten Sie das vollständige Transkript, die Audioaufzeichnung, das Ergebnis (angenommen, Nachricht, weitergeleitet, erfolgreich…) und die Möglichkeit, automatisierte Nachbearbeitungsaktionen auszulösen.
