Jump to content

Speech recognition/nl: Difference between revisions

From Clarin K-Centre
Created page with "==Tools die je zelf moet installeren=="
Created page with "LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen."
 
(12 intermediate revisions by 3 users not shown)
Line 17: Line 17:
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)


<div lang="en" dir="ltr" class="mw-content-ltr">
===Digital Europe Speech-to-Text===
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
Speech recognition built by the European Commission. Requires an EU login.
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://language-tools.ec.europa.eu/SpeechServices/Transcription Website]
</div>
<span id="LaMachine_webservices"></span>
==LaMachine-webservices==
==LaMachine-webservices==
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit.
 
LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen.


<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
<div class="mw-translate-fuzzy">
==Spraakherkenning voor Belgisch Nederlands; NeLF==
==Spraakherkenning voor Belgisch-Nederlands; NeLF==
</div>


API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Line 31: Line 43:
[https://www.nelfproject.be/web_service.php NeLF Website]
[https://www.nelfproject.be/web_service.php NeLF Website]


<div class="mw-translate-fuzzy">
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
Het [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op
De [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
</div>


<span id="Microsoft_Transcriber"></span>
<span id="Microsoft_Transcriber"></span>
<div class="mw-translate-fuzzy">
==Microsoft Transcriber==
==Microsoft Transcriber==
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* in Word 365
* in Word 365
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch]
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
</div>


<span id="To_install"></span>
<span id="To_install"></span>
==Tools die je zelf moet installeren==
==Tools die je zelf moet installeren==


<div lang="en" dir="ltr" class="mw-content-ltr">
===noScribe===
===noScribe===
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
*AI-based software that transcribes interviews for qualitative social research or journalistic use
* gratis en open-source (GPL-3.0)
*free and open source (GPL-3.0)
* draait volledig lokaal op eigen computer
*runs completely local on your computer
* maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* can distinguish different speakers and understands around 60 languages
* omvat een revieweditor om transcripts na te kijken en te corrigeren
* includes a nice editor to review, verify and correct the resulting transcript
* gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
* standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin
* [https://github.com/kaixxx/noScribe Github page]
* [https://github.com/kaixxx/noScribe Github page]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
===Whisper-model from OpenAI===
===Whisper model from OpenAI===
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>


*[https://openai.com/research/whisper Webpagina]
*[https://openai.com/research/whisper Webpagina]
Line 74: Line 73:
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.


<div lang="en" dir="ltr" class="mw-content-ltr">
==Leiderbord==
==Leaderboard==
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website]
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website]
</div>


==Interpunctie-invoeging==
==Interpunctie-invoeging==

Latest revision as of 18:08, 13 November 2025

Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.

Online services

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

  • Spraakherkenning, met verschillende modellen voor het Nederlands
  • Anonymisatietool
  • Audiosegmentatie
  • Sprekerdiarisatie
  • Stemactiviteitsdetectie

Digital Europe Speech-to-Text

Speech recognition built by the European Commission. Requires an EU login.

LaMachine-webservices

LaMachine is end-of-life en wordt niet langer ondersteund. Zie deze post voor de redenen en alternatieve oplossingen.

Spraakherkenning voor Belgisch Nederlands; NeLF

API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.

Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.

NeLF Website

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

De European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Microsoft Transcriber

Tools die je zelf moet installeren

noScribe

  • AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
  • gratis en open-source (GPL-3.0)
  • draait volledig lokaal op eigen computer
  • maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
  • gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
  • Github page

Whisper-model from OpenAI

ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.

Leiderbord

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.