Computer-mediated communication corpora/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "*versie 1.1 *data set uit 2019 (versie 1.0 uit 2012) *82.4 MB *[http://hdl.handle.net/10032/tm-a2-q4 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.]") |
No edit summary |
||
Line 1: | Line 1: | ||
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, | Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms. | ||
==Moroccorp== | ==Moroccorp== | ||
Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand | Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb. | ||
*versie 1.1 | *versie 1.1 | ||
*data set uit 2019 (versie 1.0 uit 2012) | *data set uit 2019 (versie 1.0 uit 2012) | ||
*82.4 MB | *82.4 MB | ||
*[http://hdl.handle.net/10032/tm-a2-q4 | *[http://hdl.handle.net/10032/tm-a2-q4 Downloadpagina] | ||
*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.] | ||
Line 16: | Line 16: | ||
* data set uit 2013 | * data set uit 2013 | ||
* 3.50 MB | * 3.50 MB | ||
* [http://hdl.handle.net/10032/tm-a2-k3 | * [http://hdl.handle.net/10032/tm-a2-k3 Downloadpagina] |
Latest revision as of 18:15, 25 March 2024
Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobieletelefoonapplicaties zoals Whatsapp, e-mail en chatrooms.
Moroccorp
Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand van 82.4 Mb.
- versie 1.1
- data set uit 2019 (versie 1.0 uit 2012)
- 82.4 MB
- Downloadpagina
- Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.
SoNaR Nieuwe Media Corpus
Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.
- versie 1.0
- data set uit 2013
- 3.50 MB
- Downloadpagina