Speech recognition/nl: Difference between revisions

Revision as of 09:44, 5 May 2025

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

Spraakherkenning, met verschillende modellen voor het Nederlands
Anonymisatietool
Audiosegmentatie
Sprekerdiarisatie
Stemactiviteitsdetectie

Webinterface (vereist CLARIN login)

LaMachine-webservices

Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.

Spraakherkenning voor Belgisch-Nederlands; NeLF

API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.

Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.

NeLF Website

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.

Whispermodel van OpenAI

ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.

Webpagina
Githubpagina
YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.

Microsoft Transcriber

Website in het Nederlands

@@ Line 1: / Line 1: @@
-==LaMachine webservices==
+<languages/>
-Er zijn meerdere spraakherkenningsdiensten [https://webservices.cls.ru.nl/ web services] bij de Radboud Universiteit
-==Spraakherkenning voor Belgisch-Nederlands==
+<span id="BAS_Web_Services"></span>
-Sinds April 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Het wordt gerund door de KU Leuven.
+== BAS Webservices==
-*[https://www.spraak.org/webservice/dutch_asr/ Online webservice]
+De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
-*[https://clinjournal.org/clinj/article/view/119 Wetenschappelijke publicatie over spraakherkenningsengine]
+* Spraakherkenning, met verschillende modellen voor het Nederlands
+* Anonymisatietool
+* Audiosegmentatie
+* Sprekerdiarisatie
+* Stemactiviteitsdetectie
+*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login)
+==LaMachine-webservices==
+Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit.
+<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span>
+==Spraakherkenning voor Belgisch-Nederlands; NeLF==
+API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
+Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
+[https://www.nelfproject.be/web_service.php NeLF Website]
 ==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands==
@@ Line 12: / Line 29: @@
 [https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
-==Interpunctie invoeging==
+==Interpunctie-invoeging==
-Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
+Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
-*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model]
+*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model]
-*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt bestanden als input accepteert en txt met interpunctie teruggeeft als output.]
+*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.]
-==Whisper model van OpenAI==
+==Whispermodel van OpenAI==
 ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij  Whisper. Het downloaden van het volledige model is mogelijk.
-<div lang="en" dir="ltr" class="mw-content-ltr">
+*[https://openai.com/research/whisper Webpagina]
-*[https://openai.com/research/whisper Webpage]
+*[https://github.com/openai/whisper Githubpagina]
-*[https://github.com/openai/whisper Github page]
+*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
-*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] explaining how to install whisper on your windows machine
-</div>
-<div lang="en" dir="ltr" class="mw-content-ltr">
 ==Microsoft Transcriber==
-*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch]
+*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
-</div>