Speech recognition/nl: Difference between revisions
Created page with "===noScribe===" |
Created page with "LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen." |
||
| (11 intermediate revisions by 3 users not shown) | |||
| Line 17: | Line 17: | ||
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | *[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | ||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
===Digital Europe Speech-to-Text=== | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
Speech recognition built by the European Commission. Requires an EU login. | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
*[https://language-tools.ec.europa.eu/SpeechServices/Transcription Website] | |||
</div> | |||
<span id="LaMachine_webservices"></span> | |||
==LaMachine-webservices== | ==LaMachine-webservices== | ||
LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen. | |||
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | <span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | ||
==Spraakherkenning voor Belgisch Nederlands; NeLF== | |||
==Spraakherkenning voor Belgisch | |||
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | ||
| Line 31: | Line 43: | ||
[https://www.nelfproject.be/web_service.php NeLF Website] | [https://www.nelfproject.be/web_service.php NeLF Website] | ||
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ||
De [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op | |||
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | [https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | ||
<span id="Microsoft_Transcriber"></span> | <span id="Microsoft_Transcriber"></span> | ||
==Microsoft Transcriber== | ==Microsoft Transcriber== | ||
* in Word 365 | * in Word 365 | ||
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in | *[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands] | ||
<span id="To_install"></span> | <span id="To_install"></span> | ||
| Line 53: | Line 58: | ||
===noScribe=== | ===noScribe=== | ||
* AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert | |||
*AI- | * gratis en open-source (GPL-3.0) | ||
* | * draait volledig lokaal op eigen computer | ||
* | * maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen | ||
* | * omvat een revieweditor om transcripts na te kijken en te corrigeren | ||
* | * gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin | ||
* | |||
* [https://github.com/kaixxx/noScribe Github page] | * [https://github.com/kaixxx/noScribe Github page] | ||
===Whisper-model from OpenAI=== | |||
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk. | |||
ASR | |||
*[https://openai.com/research/whisper Webpagina] | *[https://openai.com/research/whisper Webpagina] | ||
| Line 72: | Line 73: | ||
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | *[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | ||
==Leiderbord== | |||
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website] | * [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website] | ||
==Interpunctie-invoeging== | ==Interpunctie-invoeging== | ||
Latest revision as of 18:08, 13 November 2025
Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.
Online services
BAS Webservices
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
- Spraakherkenning, met verschillende modellen voor het Nederlands
- Anonymisatietool
- Audiosegmentatie
- Sprekerdiarisatie
- Stemactiviteitsdetectie
- Webinterface (vereist CLARIN login)
Digital Europe Speech-to-Text
Speech recognition built by the European Commission. Requires an EU login.
LaMachine-webservices
LaMachine is end-of-life en wordt niet langer ondersteund. Zie deze post voor de redenen en alternatieve oplossingen.
Spraakherkenning voor Belgisch Nederlands; NeLF
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
De European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Microsoft Transcriber
- in Word 365
- Website in het Nederlands
Tools die je zelf moet installeren
noScribe
- AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
- gratis en open-source (GPL-3.0)
- draait volledig lokaal op eigen computer
- maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
- gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
- Github page
Whisper-model from OpenAI
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.
- Webpagina
- Githubpagina
- YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
Leiderbord
Interpunctie-invoeging
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.