Computer-mediated communication corpora/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "Computerondersteunde communicatie corpora") |
No edit summary |
||
(2 intermediate revisions by one other user not shown) | |||
Line 1: | Line 1: | ||
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms. | |||
==Moroccorp== | ==Moroccorp== | ||
Moroccorp is | Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb. | ||
*versie 1.1 | |||
* | *data set uit 2019 (versie 1.0 uit 2012) | ||
*data set | |||
*82.4 MB | *82.4 MB | ||
*[http://hdl.handle.net/10032/tm-a2-q4 | *[http://hdl.handle.net/10032/tm-a2-q4 Downloadpagina] | ||
*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | ||
==SoNaR Nieuwe Media Corpus== | ==SoNaR Nieuwe Media Corpus== | ||
Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. | |||
* versie 1.0 | |||
* | * data set uit 2013 | ||
* data set | |||
* 3.50 MB | * 3.50 MB | ||
* [http://hdl.handle.net/10032/tm-a2-k3 | * [http://hdl.handle.net/10032/tm-a2-k3 Downloadpagina] | ||
Latest revision as of 18:15, 25 March 2024
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms.
Moroccorp
Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb.
- versie 1.1
- data set uit 2019 (versie 1.0 uit 2012)
- 82.4 MB
- Downloadpagina
- Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.
SoNaR Nieuwe Media Corpus
Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.
- versie 1.0
- data set uit 2013
- 3.50 MB
- Downloadpagina