Translations:Other corpora/16/nl

From Clarin K-Centre
Revision as of 10:39, 26 March 2024 by Griet (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Dutch Audio Description Corpus

Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audiobeschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Het is gebruikt om een reeks kwantitatieve gegevens over de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals leessnelheid, woord-en zinslengte, leesbaarheid en type-tokenratio's (een statistische maat die de lexicale variëteit weergeeft).