Av Équipe VOCALIS AI · Validert av Laurent Duplat, Publikasjonsdirektør VOCALIS AI · Basert på +250 distribusjoner siden 2023 · VOCALIS AI

TL;DRRetell AI har popularisert den talende agenten « drag-and-drop » med en annonsert latens på rundt 600 ms og et solid SIP/Twilio-økosystem, men i europeisk produksjon blir forskjellen tydeligere: Vocalis AI leverer en latens på sub-50 ms på bare-metal H100-infrastruktur, en innfødt EU/CH suverenitet og prosodisk emosjonsdeteksjon som Retell ikke tilbyr. For operasjonelle ledere som vurderer en SaaS voicebot i 2026, avgjøres valget på tre akser: time-to-first-audio, AI Act + FADP-overholdelse og kontroll av prosodi.

Retell AIs posisjonering i 2026

Retell AI, grunnlagt i 2023 og drevet av YC W24, har etablert seg som en av de mest siterte voice AI-plattformene av salgs- og kundestøtteteam i USA. Deres tilnærming: en drag-and-drop flow builder, en egen SIP trunking API og en kort læringskurve (retellai.com).

De offentlige tallene som Retell har kommunisert indikerer en p50 latens på rundt 600 ms end-to-end, en minuttsbasert prismodell og et katalog med innfødte integrasjoner som Twilio, Vonage, Plivo. I 2025 hentet selskapet inn omtrent 4 millioner dollar i seed-finansiering, noe som bekrefter en ambisiøs, men fortsatt ung oppstartposisjon på enterprise-siden i EU.

Vocalis AIs posisjonering i 2026

Vocalis AI, drevet av VOCALIS AI (), er en B2B emosjonell voice AI-agent bygget rundt tre pilarer: EU/CH suverenitet, menneskelig latens på sub-50 ms og prosodisk kontroll. Det er motoren bak mer enn 250 B2B-distribusjoner observert siden 2023 innen bank, forsikring, helse, jus, innkreving og luksus detaljhandel.

Systemet er basert på en hybridarkitektur: edge + proprietær bare-metal H100 + streaming TTS i 50 ms chunks. Denne stakken er detaljert i vår referanseartikkel om bare-metal H100-infrastruktur og FADP.

Arkitektur: SIP trunking + kaskade vs hybrid edge/bare-metal

I følge Cresta Engineering, deles latenskjeden til en voice AI-agent opp i fire budsjetter: ASR (50-150 ms), LLM (150-400 ms), TTS (50-200 ms), turtaking + nettverk (30-100 ms). Totalt p95 bør ideelt sett være <600 ms, den menneskelige toleransegrensen for samtale.

EtasjeRetell AI (typisk)Vocalis AI (hybrid bare-metal)
ASR streamingDeepgram/AssemblyAI ~150 msASR tilpasset EU, ~35 ms første-token
LLM resonneringGPT-4o/Claude API, ~250-400 msSLM lokal + LLM-ruting, ~20 ms første-token
TTS sanntidElevenLabs/Cartesia ~75-150 msEgen TTS i 50 ms chunks
Tur-taking / VAD~80 ms~20 ms, med eLLM-trigger
TTFA p50 annonsert~600 ms<50 ms

Latens: 600 ms vs sub-50 ms, samtaleinnvirkning

Hver 100 ms med ekstra latens reduserer følelsen av « naturlig » med 9 % i telefonsamtaler, ifølge akademiske studier sitert av Inworld AI om voice AI 2026 benchmarks. Forskjellen mellom 600 ms og 50 ms er derfor ikke en teknisk detalj: det er et gap på 54 % i oppfattet NPS.

Våre feltmålinger på en benchmark mot Fonio AI (380 ms vs 850 ms) bekrefter snøballeffekten på menneskelig avbrudd, samtaleretensjon og konvertering.

Drag-and-drop Retell vs Flow Builder Vocalis

Retell og Vocalis tilbyr begge en visuell redigerer for samtaleopplegg. Forskjellen:

  • Retell : drag-and-drop rettet mot utviklere, noder « melding + betingelse + ring verktøy », JSON-eksport, hot-reload ved endring
  • Vocalis : flow builder rettet mot forretning, bibliotek av forhåndskablede bransjeblokker (bestilling, kvalifisering av leads, oppfølging av ubetalte, flerspråklig velkomst), emosjonelle triggere, innfødt CRM-overføring. Se vår dokumentasjon for oppretting av agent

EU-overholdelse: GDPR, CNIL, FADP, AI Act

Retell AI er registrert i USA. Dens standard hosting er AWS us-east-1. For en europeisk overholdelse må det forhandles om en DPA, kreve region eu-west, og akseptere residual eksponering for CLOUD Act.

Vocalis AI, drevet av VOCALIS AI med EU-stakk (AWS eu-west-1 Paris + bare-metal EU), gir ved onboarding:

Flerspråklig og støttede språk

Retell støtter ~25 språk via tilkoblede TTS. Vocalis dekker 40+ språk med proprietære motorer og håndtering av regionale aksenter (sveitsisk romand, Quebec, belgisk, nordafrikansk), dokumentert i stemmer og støttede språk.

Bruksområder inbound og outbound

Der Retell utmerker seg på enkel inbound (kvalifisering, omdirigering), dekker Vocalis komplekse multi-intentions reiser:

Integrasjoner for telefoni og CRM

Retell utmerker seg på SIP/Twilio. Vocalis tilbyr samme SIP/PBX-dekning + innfødte CRM-integrasjoner (HubSpot, Salesforce, Pipedrive), kalender (Cal.com, Calendly), og WhatsApp Business, uten å gå gjennom tilpassede webhooks.

Når velge Retell, når velge Vocalis?

Velg Retell hvis: tech-startup på engelsk, enkel inbound-bruksområde, autonom utviklerteam, toleranse for 500-700 ms latens, redusert budsjett for EU-overholdelse.

Velg Vocalis AI hvis: B2B-virksomhet i EU/CH, krevende bruksområde (medisin, jus, finans, luksus), behov for prosodisk emosjon, innfødt overholdelse av AI Act + FADP, kritisk menneskelig latens.

FAQ: Vocalis vs Retell AI

Er Retell GDPR-kompatibel?

Retell kan konfigureres for GDPR-overholdelse i EU-regionen med DPA, men er fortsatt eksponert for CLOUD Act. Vocalis, drevet av VOCALIS AI, tilbyr en innfødt EU-stakk uten US-ekstraterritorial eksponering.

Hva er den faktiske latensen til Retell?

Retell kommuniserer offentlig om ~600 ms p50 end-to-end. Våre målinger bekrefter 550-780 ms i EU-produksjon avhengig av valgt ASR/LLM/TTS-kombinasjon.

Er Vocalis virkelig sub-50 ms?

Ja, på time-to-first-audio takket være streaming i 50 ms chunks og lokal SLM. Totalt end-to-end (full tur) forblir <350 ms p95 på våre distribusjoner.

Kan man migrere en Retell-agent til Vocalis?

Ja: eksport av prompts, rekonstruksjon av flow builder, kartlegging av integrasjoner, A/B-pilot i 30 dager, overgang. Typisk tidsramme 2-3 uker.

Hva er forskjellen for et advokatkontor?

Retell vil håndtere grunnleggende omdirigering. Vocalis dekker kvalifisering av sak, filtrering av konsultasjon, planlagt oppfølging og overholdelse av taushetsplikt. Se vårt tilbud for juridiske yrker.

Håndterer Vocalis sveitsiske romand aksenter?

Ja: vi trener våre ASR/TTS-modeller på sveitsiske datasett og håndterer vaudois, fribourgeois, genevois og valaisan.

Hvordan teste Vocalis mot Retell?

Bestill en live demo med en forhåndskonfigurert agent for ditt bruksområde. Vi kan sette opp en tilpasset live demo med sammenlignende måling av latens + NPS.

Del in X @

Envie de tester VOCALIS AI ?

Réservez une démo personnalisée et découvrez en direct comment notre IA vocale émotionnelle transforme vos conversations.

Réserver une démo