Computer-mediated communication corpora/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobiele telefoon applicaties zoals Whatsapp, email en chatrooms.") |
No edit summary |
||
(One intermediate revision by one other user not shown) | |||
Line 1: | Line 1: | ||
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, | Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms. | ||
==Moroccorp== | ==Moroccorp== | ||
Moroccorp is | Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb. | ||
*versie 1.1 | |||
* | *data set uit 2019 (versie 1.0 uit 2012) | ||
*data set | |||
*82.4 MB | *82.4 MB | ||
*[http://hdl.handle.net/10032/tm-a2-q4 | *[http://hdl.handle.net/10032/tm-a2-q4 Downloadpagina] | ||
*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | ||
==SoNaR Nieuwe Media Corpus== | ==SoNaR Nieuwe Media Corpus== | ||
Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. | |||
* versie 1.0 | |||
* | * data set uit 2013 | ||
* data set | |||
* 3.50 MB | * 3.50 MB | ||
* [http://hdl.handle.net/10032/tm-a2-k3 | * [http://hdl.handle.net/10032/tm-a2-k3 Downloadpagina] | ||
Latest revision as of 18:15, 25 March 2024
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms.
Moroccorp
Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb.
- versie 1.1
- data set uit 2019 (versie 1.0 uit 2012)
- 82.4 MB
- Downloadpagina
- Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.
SoNaR Nieuwe Media Corpus
Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.
- versie 1.0
- data set uit 2013
- 3.50 MB
- Downloadpagina