Speech recognition/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==Interpunctie invoeging== Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.")
(Created page with "== BAS Webservices==")
 
(6 intermediate revisions by 2 users not shown)
Line 1: Line 1:
==LaMachine webservices==
<languages/>
Er zijn meerdere spraakherkenningsdiensten [https://webservices.cls.ru.nl/ web services] bij de Radboud Universiteit
 
<span id="BAS_Web_Services"></span>
== BAS Webservices==
 
De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:
* Spraakherkenning, met verschillende modellen voor het Nederlands
* Anonymisatietool
* Audiosegmentatie
* Sprekerdiarisatie
* Stemactiviteitsdetectie
 
*[https://clarin.phonetik.uni-muenchen.de/BASWebServices/interface Webinterface]
 
 
==LaMachine-webservices==
Er zijn meerdere [https://webservices.cls.ru.nl/ spraakherkenningswebservices] bij de Radboud Universiteit.


==Spraakherkenning voor Belgisch-Nederlands==
==Spraakherkenning voor Belgisch-Nederlands==
Sinds April 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Het wordt gerund door de KU Leuven.
Sinds april 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Hij wordt gerund door de KU Leuven.


*[https://www.spraak.org/webservice/dutch_asr/ Online webservice]
*[https://www.spraak.org/webservice/dutch_asr/ Online webservice]
Line 12: Line 27:
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]
[https://live.european-language-grid.eu/catalogue/tool-service/20900 https://live.european-language-grid.eu/catalogue/tool-service/20900]


==Interpunctie invoeging==
==Interpunctie-invoeging==
Aangezien ASR output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.  
Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.  


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace-model]
*[https://huggingface.co/oliverguhr/fullstop-dutch-sonar-punctuation-prediction?text=hervatting+van+de+zitting+ik+verklaar+de+zitting+van+het+europees+parlement+die+op+vrijdag+17+december+werd+onderbroken+te+zijn+hervat HuggingFace model]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python-script dat txt-bestanden als input accepteert en txt met interpunctie teruggeeft als output.]
*[https://github.com/VincentCCL/Segment_FullStop/blob/main/Segment_FullStop.py Python script that accepts txt file as input and returns punctuated txt as output]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
==Whispermodel van OpenAI==
==Whisper model from OpenAI==
ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij  Whisper. Het downloaden van het volledige model is mogelijk.
ASR for multiple languages, including Dutch is available from Whisper. Full model download is possible.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://openai.com/research/whisper Webpagina]
*[https://openai.com/research/whisper Webpage]
*[https://github.com/openai/whisper Githubpagina]
*[https://github.com/openai/whisper Github page]
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] waarin wordt uitgelegd hoe Whisper kan worden gedownload op een Windowsmachine.
*[https://www.youtube.com/watch?v=ABFqbY_rmEk YouTube video] explaining how to install whisper on your windows machine
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
==Microsoft Transcriber==
==Microsoft Transcriber==
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in Dutch]
*[https://support.microsoft.com/nl-nl/office/uw-opnamen-transcriberen-7fc2efec-245e-45f0-b053-2a97531ecf57 Website in het Nederlands]
</div>

Latest revision as of 14:14, 19 November 2024

Other languages:

BAS Webservices

De BAS webservices zijn een rijke verzameling tools voor spraakwetenschap en -technologie. Deze verzameling bevat onder andere:

  • Spraakherkenning, met verschillende modellen voor het Nederlands
  • Anonymisatietool
  • Audiosegmentatie
  • Sprekerdiarisatie
  • Stemactiviteitsdetectie


LaMachine-webservices

Er zijn meerdere spraakherkenningswebservices bij de Radboud Universiteit.

Spraakherkenning voor Belgisch-Nederlands

Sinds april 2022 is er een nieuwe ASR-engine beschikbaar, die specifiek geschikt is voor spraakherkenning voor Belgisch-Nederlands. Hij wordt gerund door de KU Leuven.

HENSOLDT ANALYTICS Spraak-naar-tekst voor het Nederlands

Het European Language Grid host deze spraakherkenningsservice met demo op https://live.european-language-grid.eu/catalogue/tool-service/20900

Interpunctie-invoeging

Aangezien ASR-output meestal bestaat uit woordstromen, is het wellicht voordelig om automatisch interpunctie in te laten voegen.

Whispermodel van OpenAI

ASR voor meerdere talen, waaronder Nederlands, zijn beschikbaar bij Whisper. Het downloaden van het volledige model is mogelijk.

Microsoft Transcriber