Jump to content

Translations:Spoken corpora/13/nl: Difference between revisions

From Clarin K-Centre
No edit summary
No edit summary
 
Line 1: Line 1:
==SABeD -- Spoken Academic Belgian Dutch==
==SABeD -- Spoken Academic Belgian Dutch==
Het SABeD-corpusverzamelingsproject is begonnen op 1 maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal bestaan uit 200 colleges.
Het Spoken Academic Belgian Dutch Corpus (SABeD) bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de transcripties manueel geverifieerd. De resulterende teksten werden geanalyseerd door de Frog language analyser.

Latest revision as of 17:46, 3 April 2025

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Spoken corpora)
==SABeD -- Spoken Academic Belgian Dutch==
The Spoken Academic Belgian Dutch Corpus consists of 200 lectures given in higher education institutions in Flanders. The first 25 and the last 5 minutes of each lecture were transcribed using an ASR system tuned to Belgian Dutch and then manual utterance segmentation was applied, followed by manual correction of the automated transcription. The resulting text is processed with the FROG language analyser.

SABeD -- Spoken Academic Belgian Dutch

Het Spoken Academic Belgian Dutch Corpus (SABeD) bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de transcripties manueel geverifieerd. De resulterende teksten werden geanalyseerd door de Frog language analyser.