Jump to content

Translations:Spoken corpora/28/nl

From Clarin K-Centre

Het GCND, een geparseerd, gesproken corpus van Zuid-Nederlandse Dialecten is een taalkundig geannoteerd corpus gebaseerd op bestaande dialectopnames uit de jaren 1960 en 1970: Stemmen uit het verleden, aangevuld met bestaande opnames van het Meertens Instituut en een aantal nieuwe opnameshe. Het corpus biedt audio-uitgelijnde transcripties in twee lagen, één dichter bij het dialect en één dichter bij het Standaardnederlands, beide zijn ge-POS-tagd en syntactisch getagd. Het corpus is bedoeld om grootschalig onderzoek naar syntactische bijzonderheden van de Zuid-Nederlandse dialecten te vergemakkelijken.