Jump to content

Speech recognition/nl: Difference between revisions

From Clarin K-Centre
No edit summary
FuzzyBot (talk | contribs)
Updating to match new version of source page
Line 1: Line 1:
<languages/>
<languages/>
<div lang="en" dir="ltr" class="mw-content-ltr">
This page contains information on Dutch speech recognition systems.
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
==Online services==
</div>


<span id="BAS_Web_Services"></span>
<span id="BAS_Web_Services"></span>
<div class="mw-translate-fuzzy">
== BAS Webservices==
== BAS Webservices==
</div>


De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
Line 13: Line 23:
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)


<div class="mw-translate-fuzzy">
==LaMachine-webservices==
==LaMachine-webservices==
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit.
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit.
</div>


<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
<div class="mw-translate-fuzzy">
==Spraakherkenning voor Belgisch-Nederlands; NeLF==
==Spraakherkenning voor Belgisch-Nederlands; NeLF==
</div>


API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Line 25: Line 39:
[https://www.nelfproject.be/web_service.php NeLF Website]
[https://www.nelfproject.be/web_service.php NeLF Website]


<div class="mw-translate-fuzzy">
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
Het [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op
Het [https://european-language-grid.eu European Language Grid] host deze spraakherkenningsservice met demo op
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
</div>
<span id="Microsoft_Transcriber"></span>
<div class="mw-translate-fuzzy">
==Microsoft Transcriber==
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* in Word 365
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch]
</div>


==Interpunctie-invoeging==
<div lang="en" dir="ltr" class="mw-content-ltr">
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
==To install==
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
===noScribe===
</div>


*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model]
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.]
*AI-based software that transcribes interviews for qualitative social research or journalistic use
*free and open source (GPL-3.0)
*runs completely local on your computer
* can distinguish different speakers and understands around 60 languages
* includes a nice editor to review, verify and correct the resulting transcript
* standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin
* [https://github.com/kaixxx/noScribe Github page]
</div>


==Whispermodel van OpenAI==
<div lang="en" dir="ltr" class="mw-content-ltr">
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij  Whisper. Het downloaden van het volledige model is mogelijk.
===Whisper model from OpenAI===
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>


*[https://openai.com/research/whisper Webpagina]
*[https://openai.com/research/whisper Webpagina]
Line 42: Line 83:
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.


==Microsoft Transcriber==
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
==Leaderboard==
* [https://opensource-spraakherkenning-nl.github.io/ASR_NL_results/UT/N-Best/nbest_res.html Website]
</div>
 
==Interpunctie-invoeging==
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
 
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.]

Revision as of 10:18, 3 November 2025

This page contains information on Dutch speech recognition systems.

Online services

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

  • Spraakherkenning, met verschillende modellen voor het Nederlands
  • Anonymisatietool
  • Audiosegmentatie
  • Sprekerdiarisatie
  • Stemactiviteitsdetectie

LaMachine-webservices

Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.

Spraakherkenning voor Belgisch-Nederlands; NeLF

API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.

Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.

NeLF Website

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Microsoft Transcriber

To install

noScribe

  • AI-based software that transcribes interviews for qualitative social research or journalistic use
  • free and open source (GPL-3.0)
  • runs completely local on your computer
  • can distinguish different speakers and understands around 60 languages
  • includes a nice editor to review, verify and correct the resulting transcript
  • standing on the shoulders of giants: Whisper from OpenAI, faster-whisper by Guillaume Klein and pyannote from Hervé Bredin
  • Github page

Whisper model from OpenAI

ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.

Leaderboard

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.