Speech recognition/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==Interpunctie invoeging== Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.")
(Created page with "==Whisper model van OpenAI== ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.")
Line 15: Line 15:
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.  
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.  


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model]
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python script that accepts txt file as input and returns punctuated txt as output]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt bestanden als input accepteert en txt met interpunctie teruggeeft als output.]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
==Whisper model van OpenAI==
==Whisper model from OpenAI==
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij  Whisper. Het downloaden van het volledige model is mogelijk.
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">

Revision as of 13:10, 3 April 2024

LaMachine webservices

Er zijn meerdere spraakherkenningsdiensten web services bij de Radboud Universiteit

Spraakherkenning voor Belgisch-Nederlands

Sinds April 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Het wordt gerund door de KU Leuven.

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Interpunctie invoeging

Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.

Whisper model van OpenAI

ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.

Microsoft Transcriber