wav2vec2-large-xlsr-53-dutch
jonatasgrosman/wav2vec2-large-xlsr-53-dutch
A popular open speech-to-text model, with 4.1M downloads a month. gigarouter benchmarks and hosts it as an OpenAI-compatible API.
about this model
jonatasgrosman/wav2vec2-large-xlsr-53-dutch is a Dutch automatic speech recognition (ASR) model fine-tuned from Facebook's wav2vec2-large-xlsr-53 on the train and validation splits of Common Voice 6.1 and CSS10. It is optimized for audio sampled at 16 kHz.
Key strengths
- Performs well on diverse Dutch speech, including read and spontaneous utterances.
- Fine-tuned on a combination of publicly available datasets, providing broad coverage of Dutch accents and domains.
- No external language model is required for transcription—the model can be used directly.
Best for
Transcribing Dutch speech in applications such as voice assistants, subtitling, meeting transcription, and audio indexing where a specialized Dutch model is preferable to a multilingual one.
Example transcriptions
The following table shows sample reference sentences and model predictions, illustrating typical accuracy on Common Voice test data:
| Reference | Prediction |
|---|---|
| DE ABORIGINALS ZIJN DE OORSPRONKELIJKE BEWONERS VAN AUSTRALIË. | DE ABBORIGENALS ZIJN DE OORSPRONKELIJKE BEWONERS VAN AUSTRALIË |
| MIJN TOETSENBORD ZIT VOL STOF. | MIJN TOETSENBORD ZIT VOL STOF |
| ZE HAD DE BANK BESCHADIGD MET HAAR SKATEBOARD. | ZE HAD DE BANK BESCHADIGD MET HAAR SCHEETBOORD |
| WAAR LAAT JIJ JE ONDERHOUD DOEN? | WAAR LAAT JIJ HET ONDERHOUD DOEN |
| NA HET LEZEN VAN VELE BEOORDELINGEN HAD ZE EINDELIJK HAAR OOG LATEN VALLEN OP EEN LAPTOP MET EEN QWERTY TOETSENBORD. | NA HET LEZEN VAN VELE BEOORDELINGEN HAD ZE EINDELIJK HAAR OOG LATEN VALLEN OP EEN LAPTOP MET EEN QUERTITOETSEMBORD |
| DE TAMPONS ZIJN OP. | DE TAPONT ZIJN OP |
| MARIJKE KENT OLIVIER NU AL MEER DAN TWEE JAAR. | MAARRIJKEN KENT OLIEVIER NU AL MEER DAN TWEE JAAR |
| HET VOEREN VAN BROOD AAN EENDEN IS EIGENLIJK ONGEZOND VOOR DE BEESTEN. | HET VOEREN VAN BEUROT AAN EINDEN IS EIGENLIJK ONGEZOND VOOR DE BEESTEN |
| PARKET MOET JE STOFZUIGEN, TEGELS MOET JE DWEILEN. | PARKET MOET JE STOF ZUIGEN MAAR TEGELS MOET JE DWEILEN |
| IN ONZE BUURT KENT IEDEREEN ELKAAR. | IN ONZE BUURT KENT IEDEREEN ELKAAR |
Model details
- Base model: facebook/wav2vec2-large-xlsr-53
- Training datasets: Common Voice 6.1 (Dutch) and CSS10
- Input requirements: 16 kHz mono audio
We're benchmarking and onboarding wav2vec2-large-xlsr-53-dutch as a hosted, OpenAI-compatible API. Sign in for free credit and be ready when it lands, or tell us you want it and we'll prioritize it.