Transcriptie vergeleken
Hoe nauwkeurig is scryp bij Nederlandse transcriptie – en hoe veilig is je data vergeleken met de grote clouddiensten? Hier de resultaten van onze benchmark.
Transcriptienauwkeurigheid voor het Nederlands
Word Error Rate (WER) – lager is beter. Nauwkeurigheid = 100 % − WER.
← Tabel zijwaarts scrollen →
| Aanbieder | Algemeen (nauwkeurigheid) | Vakdomein (nauwkeurigheid) | WER algemeen |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Testdataset & methodologie
- De basis is een eigen testdataset van openbaar beschikbare audio-opnames uit jouw markt in de domeinen Algemeen, Gezondheid en Recht.
- Alle aanbieders zijn getest met identieke audiobestanden en een uniforme evaluatiemethode (Word Error Rate na standaardnormalisatie).
- De kolom Vakdomein toont het gemiddelde over gezondheids- en rechtsopnames. Bij vakjargon stijgt de foutmarge bij alle aanbieders – maar veel sterker bij modellen zonder domeinspecifieke training.
- Resultaten kunnen variëren afhankelijk van audiokwaliteit, aantal sprekers, dialect en het concrete gebruiksscenario.
Waarom scryp anders is opgebouwd voor gevoelige inhoud
Deze punten beschrijven de architectuur van scryp zelf. Ze zijn bewust precies geformuleerd en niet bedoeld als algemene uitspraak over elke andere aanbieder.
Versleuteling op je apparaat
Bestanden worden vóór upload in de browser versleuteld. Opgeslagen inhoud blijft permanent uitsluitend versleuteld.
Heldere EU-architectuur
Transcriptie in Oostenrijk, versleutelde opslag in Duitsland – beide binnen de EU. Zo is duidelijk waar welke verwerkingsstap plaatsvindt.
Eigen verwerkingsinfrastructuur
Voor de transcriptie worden geen externe AI-derden ingezet. Dat beperkt extra datastromen en afhankelijkheden.
Productieve browser-workflow
Bewerken, exporteren, delen en audiosync zitten direct in het product, niet alleen als losse API-bouwstenen.
Bronnen & documentatie
Aanbiederfuncties zijn geverifieerd aan de hand van officiële documentatie. Nauwkeurigheidscijfers zijn gebaseerd op de hierboven beschreven testdataset.
Modellen & nauwkeurigheid
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Aanbiederdocumentatie
- Google Cloud Speech-to-Text - Funktionsübersicht und Spracherkennung
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Übersicht und Dokumentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Entwicklerhandbuch
- Amazon Transcribe - Speaker partitioning (Diarization)
Klaar voor veilige transcriptie?
Probeer scryp gratis – versleuteld vanaf de eerste seconde.