Speech recognition/nl: Difference between revisions
Created page with "*[https://www.spraak.org/webservice/dutch_asr/ Online webservice] *[https://clinjournal.org/clinj/article/view/119 Wetenschappelijke publicatie over spraakherkenningsengine]" |
Created page with "LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen." |
||
| (30 intermediate revisions by 3 users not shown) | |||
| Line 1: | Line 1: | ||
<languages/> | |||
Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen. | |||
*[https:// | ==Online services== | ||
<span id="BAS_Web_Services"></span> | |||
== BAS Webservices== | |||
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere: | |||
* Spraakherkenning, met verschillende modellen voor het Nederlands | |||
* Anonymisatietool | |||
* Audiosegmentatie | |||
* Sprekerdiarisatie | |||
* Stemactiviteitsdetectie | |||
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
===Digital Europe Speech-to-Text=== | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
Speech recognition built by the European Commission. Requires an EU login. | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
*[https://language-tools.ec.europa.eu/SpeechServices/Transcription Website] | |||
</div> | |||
<span id="LaMachine_webservices"></span> | |||
==LaMachine-webservices== | |||
LaMachine is end-of-life en wordt niet langer ondersteund. Zie [https://github.com/proycon/LaMachine/issues/214 deze post] voor de redenen en alternatieve oplossingen. | |||
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | |||
==Spraakherkenning voor Belgisch Nederlands; NeLF== | |||
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | |||
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring. | |||
[https://www.nelfproject.be/web_service.php NeLF Website] | |||
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ||
De [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op | |||
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | [https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | ||
== | <span id="Microsoft_Transcriber"></span> | ||
==Microsoft Transcriber== | |||
* in Word 365 | |||
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands] | |||
<span id="To_install"></span> | |||
==Tools die je zelf moet installeren== | |||
===noScribe=== | |||
* | * AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert | ||
*[https://github.com/ | * gratis en open-source (GPL-3.0) | ||
* draait volledig lokaal op eigen computer | |||
* maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen | |||
* omvat een revieweditor om transcripts na te kijken en te corrigeren | |||
* gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin | |||
* [https://github.com/kaixxx/noScribe Github page] | |||
==Whisper model | ===Whisper-model from OpenAI=== | ||
ASR voor meerdere talen, | ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk. | ||
*[https://openai.com/research/whisper Webpagina] | *[https://openai.com/research/whisper Webpagina] | ||
*[https://github.com/openai/whisper | *[https://github.com/openai/whisper Githubpagina] | ||
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een | *[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | ||
== | ==Leiderbord== | ||
*[https:// | * [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website] | ||
==Interpunctie-invoeging== | |||
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | |||
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model] | |||
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | |||
Latest revision as of 18:08, 13 November 2025
Deze pagina bevat informatie over Nederlandse spraakherkenningssystemen.
Online services
BAS Webservices
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
- Spraakherkenning, met verschillende modellen voor het Nederlands
- Anonymisatietool
- Audiosegmentatie
- Sprekerdiarisatie
- Stemactiviteitsdetectie
- Webinterface (vereist CLARIN login)
Digital Europe Speech-to-Text
Speech recognition built by the European Commission. Requires an EU login.
LaMachine-webservices
LaMachine is end-of-life en wordt niet langer ondersteund. Zie deze post voor de redenen en alternatieve oplossingen.
Spraakherkenning voor Belgisch Nederlands; NeLF
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
De European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Microsoft Transcriber
- in Word 365
- Website in het Nederlands
Tools die je zelf moet installeren
noScribe
- AI-gebaseerde software die interviews voor kwalitatief sociaal onderzoek en journalistiek gebruik transcribeert
- gratis en open-source (GPL-3.0)
- draait volledig lokaal op eigen computer
- maakt onderscheid tussen verschillende sprekers en kent ongeveer 60 talen
* omvat een revieweditor om transcripts na te kijken en te corrigeren
- gebruikt software van big tech: Whisper van OpenAI, faster-whisper door Guillaume Klein en pyannote van Hervé Bredin
- Github page
Whisper-model from OpenAI
ASR voor meerdere talen, inclusier Nederlands, is beschikbaar bij Whisper. Volledige download van het model is mogelijk.
- Webpagina
- Githubpagina
- YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
Leiderbord
Interpunctie-invoeging
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.