Newspaper corpora/nl: Revision history

Jump to navigation Jump to search

Diff selection: Mark the radio buttons of the revisions to compare and hit enter or the button at the bottom.
Legend: (cur) = difference with latest revision, (prev) = difference with preceding revision, m = minor edit.

25 March 2024

13 March 2024

  • curprev 12:3912:39, 13 March 2024Floyd talk contribs 3,815 bytes −56 Created page with "Er is een overeenkomst met Wablieft voor de verspreiding van dit materiaal voor niet-commerciële doeleinden. Commerciële partijen kunnen contact opnemen met Wablieft om een licentie voor het materiaal te verkrijgen."
  • curprev 12:3012:30, 13 March 2024Floyd talk contribs 3,871 bytes −53 Created page with "==Corpus VU-DNC (VU University Diachronic News text Corpus)== Het VU-DNC Corpus is een diachroon Nederlands krantencorpus (VU Free University Dutch Newspaper Corpus)."
  • curprev 12:1412:14, 13 March 2024Floyd talk contribs 3,924 bytes −43 Created page with "* 2009-2021 archief van een krant in eenvoudige taal in Belgisch Nederlands * versie 1.0 * [http://hdl.handle.net/10032/tm-a2-t9 Download pagina]"
  • curprev 12:1312:13, 13 March 2024Floyd talk contribs 3,967 bytes −69 Created page with "De data is beschikbaar in verschillende formaten: oorspronkelijke tekstbestanden, tekstbestanden met één zin per lijn, geannoteerd met Frog (POS-tagging, lemmatisering, morfologie, named entity recognition, chunking, dependency relaties) in FoLiA of CoNNL, en syntactisch geanalyseerd met Alpino, in Alpino-xml."
  • curprev 11:5911:59, 13 March 2024Floyd talk contribs 4,036 bytes −119 Created page with "Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata beschikbaar i.v.m. de krantenrubriek (binnenland, sport, ...) en de publicatiedatum. Het betreft al het materiaal sinds de krant volledig digitaal en online beschikbaar is, van 2011 tot december 2017."
  • curprev 10:0510:05, 13 March 2024Floyd talk contribs 4,155 bytes −56 Created page with "==SumNL: samenvattingencorpus== Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten."
  • curprev 10:0210:02, 13 March 2024Floyd talk contribs 4,211 bytes +4,211 Created page with "==SoNaR corpus== Het SoNaR Corpus heeft een krantencomponent (WR-P-P-G) dat bestaat uit bijna 15 miljoen zinnen. Zie ook Referentie corpora. * [https://opensonar.ivdnt.org Online zoeken] * [http://hdl.handle.net/10032/tm-a2-h5 Download pagina] * [http://lands.let.ru.nl/projects/SoNaR/ Project pagina]"