Speech recognition/nl: Difference between revisions
No edit summary |
(Created page with "== BAS Webservices==") |
||
(One intermediate revision by one other user not shown) | |||
Line 1: | Line 1: | ||
<languages/> | |||
<span id="BAS_Web_Services"></span> | |||
== BAS Webservices== | |||
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere: | |||
* Spraakherkenning, met verschillende modellen voor het Nederlands | |||
* Anonymisatietool | |||
* Audiosegmentatie | |||
* Sprekerdiarisatie | |||
* Stemactiviteitsdetectie | |||
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface] | |||
==LaMachine-webservices== | ==LaMachine-webservices== | ||
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit. | Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit. | ||
Line 18: | Line 33: | ||
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | *[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | ||
== | ==Whispermodel van OpenAI== | ||
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk. | ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk. | ||
Latest revision as of 14:14, 19 November 2024
BAS Webservices
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
- Spraakherkenning, met verschillende modellen voor het Nederlands
- Anonymisatietool
- Audiosegmentatie
- Sprekerdiarisatie
- Stemactiviteitsdetectie
LaMachine-webservices
Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.
Spraakherkenning voor Belgisch-Nederlands
Sinds april 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Hij wordt gerund door de KU Leuven.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Interpunctie-invoeging
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
- HuggingFace-model
- Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.
Whispermodel van OpenAI
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.
- Webpagina
- Githubpagina
- YouTube video waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.