Speech recognition/nl: Difference between revisions
No edit summary |
Updating to match new version of source page |
||
| Line 1: | Line 1: | ||
<languages/> | <languages/> | ||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
This page contains information on Dutch speech recognition systems. | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
==Online services== | |||
</div> | |||
<span id="BAS_Web_Services"></span> | <span id="BAS_Web_Services"></span> | ||
<div class="mw-translate-fuzzy"> | |||
== BAS Webservices== | == BAS Webservices== | ||
</div> | |||
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere: | De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere: | ||
| Line 13: | Line 23: | ||
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | *[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | ||
<div class="mw-translate-fuzzy"> | |||
==LaMachine-webservices== | ==LaMachine-webservices== | ||
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit. | Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit. | ||
</div> | |||
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | <span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | ||
<div class="mw-translate-fuzzy"> | |||
==Spraakherkenning voor Belgisch-Nederlands; NeLF== | ==Spraakherkenning voor Belgisch-Nederlands; NeLF== | ||
</div> | |||
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | ||
| Line 25: | Line 39: | ||
[https://www.nelfproject.be/web_service.php NeLF Website] | [https://www.nelfproject.be/web_service.php NeLF Website] | ||
<div class="mw-translate-fuzzy"> | |||
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ||
Het [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op | Het [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op | ||
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | [https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | ||
</div> | |||
<span id="Microsoft_Transcriber"></span> | |||
<div class="mw-translate-fuzzy"> | |||
==Microsoft Transcriber== | |||
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands] | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
* in Word 365 | |||
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch] | |||
</div> | |||
== | <div lang="en" dir="ltr" class="mw-content-ltr"> | ||
==To install== | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
===noScribe=== | |||
</div> | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | |||
*[https://github.com/ | *AI-based software that transcribes interviews for qualitative social research or journalistic use | ||
*free and open source (GPL-3.0) | |||
*runs completely local on your computer | |||
* can distinguish different speakers and understands around 60 languages | |||
* includes a nice editor to review, verify and correct the resulting transcript | |||
* standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin | |||
* [https://github.com/kaixxx/noScribe Github page] | |||
</div> | |||
== | <div lang="en" dir="ltr" class="mw-content-ltr"> | ||
ASR | ===Whisper model from OpenAI=== | ||
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible. | |||
</div> | |||
*[https://openai.com/research/whisper Webpagina] | *[https://openai.com/research/whisper Webpagina] | ||
| Line 42: | Line 83: | ||
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | *[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | ||
== | <div lang="en" dir="ltr" class="mw-content-ltr"> | ||
*[https:// | ==Leaderboard== | ||
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website] | |||
</div> | |||
==Interpunctie-invoeging== | |||
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | |||
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model] | |||
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | |||
Revision as of 10:18, 3 November 2025
This page contains information on Dutch speech recognition systems.
Online services
BAS Webservices
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
- Spraakherkenning, met verschillende modellen voor het Nederlands
- Anonymisatietool
- Audiosegmentatie
- Sprekerdiarisatie
- Stemactiviteitsdetectie
- Webinterface (vereist CLARIN login)
LaMachine-webservices
Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.
Spraakherkenning voor Belgisch-Nederlands; NeLF
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Microsoft Transcriber
- in Word 365
- Website in Dutch
To install
noScribe
- AI-based software that transcribes interviews for qualitative social research or journalistic use
- free and open source (GPL-3.0)
- runs completely local on your computer
- can distinguish different speakers and understands around 60 languages
- includes a nice editor to review, verify and correct the resulting transcript
- standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin
- Github page
Whisper model from OpenAI
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
- Webpagina
- Githubpagina
- YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
Leaderboard
Interpunctie-invoeging
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.