Computerondersteunde communicatie corpora

From Clarin K-Centre
Revision as of 18:15, 25 March 2024 by Griet (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms.

Moroccorp

Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb.

SoNaR Nieuwe Media Corpus

Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.