User contributions for Floyd
Jump to navigation
Jump to search
13 March 2024
- 13:5213:52, 13 March 2024 diff hist −179 Computer-mediated communication corpora/nl Created page with "*versie 1.1 *data set uit 2019 (versie 1.0 uit 2012) *82.4 MB *[http://hdl.handle.net/10032/tm-a2-q4 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.]"
- 13:5213:52, 13 March 2024 diff hist +99 N Translations:Computer-mediated communication corpora/5/nl Created page with "* versie 1.0 * data set uit 2013 * 3.50 MB * [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]"
- 13:5113:51, 13 March 2024 diff hist +256 N Translations:Computer-mediated communication corpora/4/nl Created page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd." current
- 13:3513:35, 13 March 2024 diff hist +379 N Translations:Computer-mediated communication corpora/3/nl Created page with "*versie 1.1 *data set uit 2019 (versie 1.0 uit 2012) *82.4 MB *[http://hdl.handle.net/10032/tm-a2-q4 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/RuetteVandeVelde_2013final_Moroccorp_corpus_chattaal.pdf Ruette, T. and van de Velde, F. (2013) Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos 23: 456-475.]"
- 13:3313:33, 13 March 2024 diff hist +245 N Translations:Computer-mediated communication corpora/2/nl Created page with "==Moroccorp== Moroccorp is een corpus van computerondersteunde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, bestaand uit tien miljoen woorden aan chatmateriaal. De data wordt geleverd in een .txt bestand of 82.4 Mb."
- 13:2913:29, 13 March 2024 diff hist −69 Computer-mediated communication corpora/nl Created page with "Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobiele telefoon applicaties zoals Whatsapp, email en chatrooms."
- 13:2913:29, 13 March 2024 diff hist +272 N Translations:Computer-mediated communication corpora/1/nl Created page with "Computerondersteunde communicatie omvat openbare en private communicatieve handelingen online, zoals posts op blogs en fora, reacties op online nieuwssites, sociale media en netwerksites zoals X en Facebook, mobiele telefoon applicaties zoals Whatsapp, email en chatrooms."
- 13:2513:25, 13 March 2024 diff hist +1,507 N Computer-mediated communication corpora/nl Created page with "Computerondersteunde communicatie corpora"
- 13:1813:18, 13 March 2024 diff hist +41 N Translations:Computer-mediated communication corpora/Page display title/nl Created page with "Computerondersteunde communicatie corpora" current
- 13:1813:18, 13 March 2024 diff hist +55 Computer-mediated communication corpora Marked this version for translation
- 13:1713:17, 13 March 2024 diff hist +25 Computer-mediated communication corpora No edit summary
- 13:1613:16, 13 March 2024 diff hist −51 Parliamentary corpora/nl Created page with "Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement België (Frans & Nederlands)]. Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en besluitvoering beschikbaar te stellen. Dit zal worden getest..."
- 13:1513:15, 13 March 2024 diff hist +13 Parliamentary corpora No edit summary current
- 13:1513:15, 13 March 2024 diff hist +289 N Translations:Parliamentary corpora/5/nl Created page with "[https://opus.nlpl.eu/Europarl.php Europarl data] op de OPUS website: een parallelle corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om statistisch machinevertalingsonderzoek te ondersteunen."
- 13:0713:07, 13 March 2024 diff hist +28 N Translations:Parliamentary corpora/4/nl Created page with "== Europees Parlement data=="
- 13:0713:07, 13 March 2024 diff hist +105 N Translations:Parliamentary corpora/3/nl Created page with "* [https://www.clarin.si/repository/xmlui/handle/11356/1432 Meertalige vergelijkende dataset beschikbaar]" current
- 13:0413:04, 13 March 2024 diff hist +555 N Translations:Parliamentary corpora/2/nl Created page with "Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement België (Frans & Nederlands)]. Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en besluitvoering beschikbaar te stellen. Dit zal worden getest..."
- 12:5112:51, 13 March 2024 diff hist +1,438 N Parliamentary corpora/nl Created page with "We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen."
- 12:4612:46, 13 March 2024 diff hist +357 N Translations:Parliamentary corpora/1/nl Created page with "We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen."
- 12:4312:43, 13 March 2024 diff hist +21 N Translations:Parliamentary corpora/Page display title/nl Created page with "Parlementaire corpora" current
- 12:4212:42, 13 March 2024 diff hist +55 Parliamentary corpora Marked this version for translation
- 12:4212:42, 13 March 2024 diff hist +25 Parliamentary corpora No edit summary
- 12:3912:39, 13 March 2024 diff hist +13 Newspaper corpora No edit summary current
- 12:3912:39, 13 March 2024 diff hist −56 Newspaper corpora/nl Created page with "Er is een overeenkomst met Wablieft voor de verspreiding van dit materiaal voor niet-commerciële doeleinden. Commerciële partijen kunnen contact opnemen met Wablieft om een licentie voor het materiaal te verkrijgen."
- 12:3812:38, 13 March 2024 diff hist +70 N Translations:Newspaper corpora/13/nl Created page with "* [https://ivdnt.org/wp-content/apps/vu-dnc/index.html Corpus website]"
- 12:3812:38, 13 March 2024 diff hist +850 N Translations:Newspaper corpora/12/nl Created page with "Het corpus bestaat uit data van vijf kranten: Algemeen Dagblad, NRC (Handelsblad), De Telegraaf, Trouw en de Volkskrant. Voor elk van de kranten is data van twee jaren (1950-1951 en 2002) beschikbaar. De artikelen zijn geselecteerd per onderwerp (bijv. voorpaginanieuws, buitenlands nieuws en sportnieuws). Een bijzonder kenmerk van het corpus is dat zowel de aanwezige subjectieve elementen, als de aanwezige directe rede zijn geannoteerd. De subjectieve elementen zijn gean..."
- 12:3012:30, 13 March 2024 diff hist −53 Newspaper corpora/nl Created page with "==Corpus VU-DNC (VU University Diachronic News text Corpus)== Het VU-DNC Corpus is een diachroon Nederlands krantencorpus (VU Free University Dutch Newspaper Corpus)."
- 12:1712:17, 13 March 2024 diff hist +166 N Translations:Newspaper corpora/11/nl Created page with "==Corpus VU-DNC (VU University Diachronic News text Corpus)== Het VU-DNC Corpus is een diachroon Nederlands krantencorpus (VU Free University Dutch Newspaper Corpus)."
- 12:1412:14, 13 March 2024 diff hist −43 Newspaper corpora/nl Created page with "* 2009-2021 archief van een krant in eenvoudige taal in Belgisch Nederlands * versie 1.0 * [http://hdl.handle.net/10032/tm-a2-t9 Download pagina]"
- 12:1412:14, 13 March 2024 diff hist +145 N Translations:Newspaper corpora/10/nl Created page with "* 2009-2021 archief van een krant in eenvoudige taal in Belgisch Nederlands * versie 1.0 * [http://hdl.handle.net/10032/tm-a2-t9 Download pagina]"
- 12:1312:13, 13 March 2024 diff hist −69 Newspaper corpora/nl Created page with "De data is beschikbaar in verschillende formaten: oorspronkelijke tekstbestanden, tekstbestanden met één zin per lijn, geannoteerd met Frog (POS-tagging, lemmatisering, morfologie, named entity recognition, chunking, dependency relaties) in FoLiA of CoNNL, en syntactisch geanalyseerd met Alpino, in Alpino-xml."
- 12:1312:13, 13 March 2024 diff hist +210 N Translations:Newspaper corpora/9/nl Created page with "==WAI-NOT Corpus == Het WAI-NOT Corpus bevat het digitaal archief van de [https://www.wai-not.be/page/10 WAI-NOT krant] (periode 2009-2021). De krantenartikelen zijn geschreven in makkelijk te lezen Nederlands."
- 12:0912:09, 13 March 2024 diff hist +586 N Translations:Newspaper corpora/8/nl Created page with "* 2011-2017 archief van een krant in eenvoudige taal in Belgisch Nederlands. * gemarkeerd, gelemmatiseerd, geparseerd, beschikbaar in verscheidene bestandsformaten * versie 1.2 * [https://limo.libis.be/primo-explore/fulldisplay?docid=LIRIAS2859003&context=L&vid=Lirias&search_scope=Lirias&tab=default_tab&lang=en_US&fromSitemap=1 Vincent Vandeghinste, Bram Bulté & Liesbeth Augustinus (2019). Wablieft: An Easy-to-Read Newspaper corpus for Dutch. In ''CLARIN Annual Confere..."
- 11:5911:59, 13 March 2024 diff hist −119 Newspaper corpora/nl Created page with "Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata beschikbaar i.v.m. de krantenrubriek (binnenland, sport, ...) en de publicatiedatum. Het betreft al het materiaal sinds de krant volledig digitaal en online beschikbaar is, van 2011 tot december 2017."
- 11:5911:59, 13 March 2024 diff hist +217 N Translations:Newspaper corpora/7/nl Created page with "Er is een overeenkomst met Wablieft voor de verspreiding van dit materiaal voor niet-commerciële doeleinden. Commerciële partijen kunnen contact opnemen met Wablieft om een licentie voor het materiaal te verkrijgen." current
- 11:5811:58, 13 March 2024 diff hist +313 N Translations:Newspaper corpora/6/nl Created page with "De data is beschikbaar in verschillende formaten: oorspronkelijke tekstbestanden, tekstbestanden met één zin per lijn, geannoteerd met Frog (POS-tagging, lemmatisering, morfologie, named entity recognition, chunking, dependency relaties) in FoLiA of CoNNL, en syntactisch geanalyseerd met Alpino, in Alpino-xml."
- 11:5811:58, 13 March 2024 diff hist +294 N Translations:Newspaper corpora/5/nl Created page with "Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata beschikbaar i.v.m. de krantenrubriek (binnenland, sport, ...) en de publicatiedatum. Het betreft al het materiaal sinds de krant volledig digitaal en online beschikbaar is, van 2011 tot december 2017."
- 10:0510:05, 13 March 2024 diff hist −56 Newspaper corpora/nl Created page with "==SumNL: samenvattingencorpus== Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten."
- 10:0310:03, 13 March 2024 diff hist +200 N Translations:Newspaper corpora/4/nl Created page with "==Wablieft corpus: eenvoudige taal== Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief." current
- 10:0210:02, 13 March 2024 diff hist +4,211 N Newspaper corpora/nl Created page with "==SoNaR corpus== Het SoNaR Corpus heeft een krantencomponent (WR-P-P-G) dat bestaat uit bijna 15 miljoen zinnen. Zie ook Referentie corpora. * [https://opensonar.ivdnt.org Online zoeken] * [http://hdl.handle.net/10032/tm-a2-h5 Download pagina] * [http://lands.let.ru.nl/projects/SoNaR/ Project pagina]"
- 10:0210:02, 13 March 2024 diff hist +101 N Translations:Newspaper corpora/3/nl Created page with "* versie 1.0.1 * data set uit 2014 * 1.60 MB * [http://hdl.handle.net/10032/tm-a2-h7 Download pagina]"
- 10:0110:01, 13 March 2024 diff hist +332 N Translations:Newspaper corpora/2/nl Created page with "==SumNL: samenvattingencorpus== Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten." current
- 09:5909:59, 13 March 2024 diff hist +305 N Translations:Newspaper corpora/1/nl Created page with "==SoNaR corpus== Het SoNaR Corpus heeft een krantencomponent (WR-P-P-G) dat bestaat uit bijna 15 miljoen zinnen. Zie ook Referentie corpora. * [https://opensonar.ivdnt.org Online zoeken] * [http://hdl.handle.net/10032/tm-a2-h5 Download pagina] * [http://lands.let.ru.nl/projects/SoNaR/ Project pagina]"
- 09:5509:55, 13 March 2024 diff hist +15 N Translations:Newspaper corpora/Page display title/nl Created page with "Kranten corpora"
- 09:4509:45, 13 March 2024 diff hist +13 Corpora No edit summary
- 09:4509:45, 13 March 2024 diff hist +512 N Corpora/nl Created page with "Corpora"
- 09:4409:44, 13 March 2024 diff hist +7 N Translations:Corpora/Page display title/nl Created page with "Corpora" current
- 09:4409:44, 13 March 2024 diff hist +512 N Translations:Corpora/1/nl Created page with "* Kranten corpora: corpora die uitsluitend bestaan uit krantenteksten * Parlementaire corpora * Computerondersteunde communicatie corpora * Corpora van academische teksten * Historische corpora * L2 learner corpora * Handmatig geannoteerde corpora * Multimodale corpora * Parallelle corpora * Referentie corpora * Sociale media corpora * Gesproken corpora * Gebarentaal corpora * Propbanks: bevat semantische rol labels..."
12 March 2024
- 15:3315:33, 12 March 2024 diff hist +11 Corpora Marked this version for translation
- 15:2915:29, 12 March 2024 diff hist +13 Spelling No edit summary