Speech recognition/nl: Difference between revisions
Created page with "==Whisper model van OpenAI== ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk." |
No edit summary |
||
| (12 intermediate revisions by 4 users not shown) | |||
| Line 1: | Line 1: | ||
<languages/> | |||
== | <span id="BAS_Web_Services"></span> | ||
== BAS Webservices== | |||
*[https:// | De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere: | ||
* Spraakherkenning, met verschillende modellen voor het Nederlands | |||
* Anonymisatietool | |||
* Audiosegmentatie | |||
* Sprekerdiarisatie | |||
* Stemactiviteitsdetectie | |||
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] (vereist CLARIN login) | |||
==LaMachine-webservices== | |||
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit. | |||
<span id="Speech_Recognition_for_Belgian_Dutch:_NeLF"></span> | |||
==Spraakherkenning voor Belgisch-Nederlands; NeLF== | |||
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent. | |||
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring. | |||
[https://www.nelfproject.be/web_service.php NeLF Website] | |||
==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ==HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands== | ||
| Line 12: | Line 29: | ||
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | [https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900] | ||
==Interpunctie invoeging== | ==Interpunctie-invoeging== | ||
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | ||
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model] | *[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model] | ||
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | *[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | ||
== | ==Whispermodel van OpenAI== | ||
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk. | ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk. | ||
*[https://openai.com/research/whisper Webpagina] | |||
*[https://openai.com/research/whisper | *[https://github.com/openai/whisper Githubpagina] | ||
*[https://github.com/openai/whisper | *[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine. | ||
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] | |||
==Microsoft Transcriber== | ==Microsoft Transcriber== | ||
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in | *[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands] | ||
Revision as of 09:44, 5 May 2025
BAS Webservices
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
- Spraakherkenning, met verschillende modellen voor het Nederlands
- Anonymisatietool
- Audiosegmentatie
- Sprekerdiarisatie
- Stemactiviteitsdetectie
- Webinterface (vereist CLARIN login)
LaMachine-webservices
Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.
Spraakherkenning voor Belgisch-Nederlands; NeLF
API- en browsertoegang van een state-of-the-art spraakherkenningssysteem voor Belgisch Nederlands, inclusief dialectherkenning. Ontwikkeld door KU Leuven en UGent.
Vereist een login die aangevraagd moet worden, waarbij gewacht moet worden op manuele goedkeuring.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Interpunctie-invoeging
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
- HuggingFace-model
- Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.
Whispermodel van OpenAI
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.
- Webpagina
- Githubpagina
- YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.