Jump to content

Translations:Spoken corpora/13/nl

From Clarin K-Centre
Revision as of 17:46, 3 April 2025 by Griet (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

SABeD -- Spoken Academic Belgian Dutch

Het Spoken Academic Belgian Dutch Corpus (SABeD) bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de transcripties manueel geverifieerd. De resulterende teksten werden geanalyseerd door de Frog language analyser.