Jump to content

Speech recognition/nl: Difference between revisions

From Clarin K-Centre
Created page with "* AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert * gratis en open-source (GPL-3.0) * draait volledig lokaal op eigen computer * maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen * omvat een revieweditor om transcripts na te kijken en te corrigeren * gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin * [https://githu..."
Created page with "===Whisper-model from OpenAI=== ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk."
Line 61: Line 61:
* [https://github.com/kaixxx/noScribe Github page]
* [https://github.com/kaixxx/noScribe Github page]


<div lang="en" dir="ltr" class="mw-content-ltr">
===Whisper-model from OpenAI===
===Whisper model from OpenAI===
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>


*[https://openai.com/research/whisper Webpagina]
*[https://openai.com/research/whisper Webpagina]

Revision as of 10:24, 3 November 2025

Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.

Online services

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

  • Spraakherkenning, met verschillende modellen voor het Nederlands
  • Anonymisatietool
  • Audiosegmentatie
  • Sprekerdiarisatie
  • Stemactiviteitsdetectie

LaMachine-webservices

Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.

Spraakherkenning voor Belgisch-Nederlands; NeLF

API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.

Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.

NeLF Website

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Microsoft Transcriber

Tools die je zelf moet installeren

noScribe

  • AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
  • gratis en open-source (GPL-3.0)
  • draait volledig lokaal op eigen computer
  • maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
  • gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
  • Github page

Whisper-model from OpenAI

ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.

Leaderboard

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.