Jump to content

Speech recognition/nl: Difference between revisions

From Clarin K-Centre
Created page with "==LaMachine webservices== Er zijn meerdere spraakherkenningsdiensten [https://webservices.cls.ru.nl/ web services] bij de Radboud Universiteit"
 
Created page with "LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen."
 
(34 intermediate revisions by 4 users not shown)
Line 1: Line 1:
==LaMachine webservices==
<languages/>
Er zijn meerdere spraakherkenningsdiensten [https://webservices.cls.ru.nl/ web services] bij de Radboud Universiteit


==Spraakherkenning voor Belgisch-Nederlands==
Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.
Sinds April 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Het wordt gerund door de KU Leuven.


*[https://www.spraak.org/webservice/dutch_asr/ Online webservice]
==Online services==
*[https://clinjournal.org/clinj/article/view/119 Wetenschappelijke publicatie over spraakherkenningsengine]


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="BAS_Web_Services"></span>
==HENSOLDT ANALYTICS Speech-to-text for Dutch==
== BAS Webservices==
The [https://european-language-grid.eu European Language Grid] hosts this speech recognition service with demo at
 
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
</div>
* Spraakherkenning, met verschillende modellen voor het Nederlands
* Anonymisatietool
* Audiosegmentatie
* Sprekerdiarisatie
* Stemactiviteitsdetectie


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)
==Punctuation Insertion==
AS ASR output often consists of streams of words, you may want to automatically insert punctuation.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model]
===Digital Europe Speech-to-Text===
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python script that accepts txt file as input and returns punctuated txt as output]
</div>
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">
==Whisper model from OpenAI==
Speech recognition built by the European Commission. Requires an EU login.
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://openai.com/research/whisper Webpage]
*[https://language-tools.ec.europa.eu/SpeechServices/Transcription Website]
*[https://github.com/openai/whisper Github page]
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] explaining how to install whisper on your windows machine
</div>
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="LaMachine_webservices"></span>
==LaMachine-webservices==
 
LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen.
 
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
==Spraakherkenning voor Belgisch Nederlands; NeLF==
 
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
 
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
 
[https://www.nelfproject.be/web_service.php NeLF Website]
 
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
De [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
 
<span id="Microsoft_Transcriber"></span>
==Microsoft Transcriber==
==Microsoft Transcriber==
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch]
 
</div>
* in Word 365
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
 
<span id="To_install"></span>
==Tools die je zelf moet installeren==
 
===noScribe===
 
* AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
* gratis en open-source (GPL-3.0)
* draait volledig lokaal op eigen computer
* maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
* gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote  van Hervé Bredin
* [https://github.com/kaixxx/noScribe Github page]
 
===Whisper-model from OpenAI===
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.
 
*[https://openai.com/research/whisper Webpagina]
*[https://github.com/openai/whisper Githubpagina]
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
 
==Leiderbord==
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website]
 
==Interpunctie-invoeging==
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
 
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.]

Latest revision as of 18:08, 13 November 2025

Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.

Online services

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

  • Spraakherkenning, met verschillende modellen voor het Nederlands
  • Anonymisatietool
  • Audiosegmentatie
  • Sprekerdiarisatie
  • Stemactiviteitsdetectie

Digital Europe Speech-to-Text

Speech recognition built by the European Commission. Requires an EU login.

LaMachine-webservices

LaMachine is end-of-life en wordt niet langer ondersteund. Zie deze post voor de redenen en alternatieve oplossingen.

Spraakherkenning voor Belgisch Nederlands; NeLF

API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.

Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.

NeLF Website

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

De European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Microsoft Transcriber

Tools die je zelf moet installeren

noScribe

  • AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
  • gratis en open-source (GPL-3.0)
  • draait volledig lokaal op eigen computer
  • maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
  • gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
  • Github page

Whisper-model from OpenAI

ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.

Leiderbord

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.