Speech recognition/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "==Interpunctie invoeging== Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.") |
(Created page with "==Whisper model van OpenAI== ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.") |
||
Line 15: | Line 15: | ||
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen. | ||
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model] | *[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model] | ||
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python script | *[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt bestanden als input accepteert en txt met interpunctie teruggeeft als output.] | ||
==Whisper model van OpenAI== | |||
==Whisper model | ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk. | ||
ASR | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | <div lang="en" dir="ltr" class="mw-content-ltr"> |
Revision as of 13:10, 3 April 2024
LaMachine webservices
Er zijn meerdere spraakherkenningsdiensten web services bij de Radboud Universiteit
Spraakherkenning voor Belgisch-Nederlands
Sinds April 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Het wordt gerund door de KU Leuven.
HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands
Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900
Interpunctie invoeging
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.
- HuggingFace model
- Python-script dat txt bestanden als input accepteert en txt met interpunctie teruggeeft als output.
Whisper model van OpenAI
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.
- Webpage
- Github page
- YouTube video explaining how to install whisper on your windows machine