Main public logs
Appearance
Combined display of all available logs of Clarin K-Centre. You can narrow down the view by selecting a log type, the username (case-sensitive), or the affected page (also case-sensitive).
- 14:05, 21 March 2024 Floyd talk contribs created page Translations:Lexica/11/nl (Created page with "=== CELEX and WebCelex === Interface waarmee de CELEX-lexicale databases van het Duits, Engels, Nederlands kunnen worden geraadpleegd. Voor iedere taal zijn de lemma's aangevuld met orthografische, fonologische, morfologische en syntactische informatie en frequentiegegevens.")
- 14:01, 21 March 2024 Floyd talk contribs created page Translations:Lexica/10/nl (Created page with "*[https://cental.uclouvain.be/cefrlex/nt2lex Bron website]")
- 14:00, 21 March 2024 Floyd talk contribs created page Translations:Lexica/9/nl (Created page with "=== NT2Lex === NT2Lex is een lexicale database voor het Nederlands als een buitenlandse taal (NT2) en bevat frequentieverdelingen van in teksten waargenomen woorden die zijn becijferd op basis van de zes-niveaus tellende schaal van het Common European Framework of Reference for Languages. Beschikbaar om online te doorzoeken en om te downloaden.")
- 13:54, 21 March 2024 Floyd talk contribs created page Translations:Lexica/8/nl (Created page with "*[https://ivdnt.org/corpora-lexica/gigant/ Projectbeschrijving] *[http://hdl.handle.net/10032/tm-a2-u7 Download pagina GiGaNT-Molex]")
- 13:54, 21 March 2024 Floyd talk contribs created page Translations:Lexica/7/nl (Created page with "GiGaNT Molex versie 1.0 is uitgegeven en is beschikbaar om te downloaden.")
- 13:54, 21 March 2024 Floyd talk contribs created page Lexica/nl (Created page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora.")
- 13:53, 21 March 2024 Floyd talk contribs created page Translations:Lexica/6/nl (Created page with "De standaardmodules van GiGaNT Hilex zijn beschikbaar gemaakt doormiddel van een lexicon-service. Als u gebruik wilt maken van deze service, neem dan contact op met [mailto://katrien.depuydt@ivdnt.org Katrien Depuydt].")
- 13:51, 21 March 2024 Floyd talk contribs created page Translations:Lexica/5/nl (Created page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora.")
- 13:51, 21 March 2024 Floyd talk contribs created page Translations:Lexica/4/nl (Created page with "Op dit moment ontwikkelt het Instituut voor de Nederlandse Taal (INT) een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon, met de naam GiGaNT, vormt straks een verzameling van woorden en woordgroepen, waaronder named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten.")
- 13:50, 21 March 2024 Floyd talk contribs created page Translations:Lexica/3/nl (Created page with "*[http://diamant.ivdnt.org/diamant-ui/ Weblink] *[https://ivdnt.org/corpora-lexica/diamant/#diamant Projectbeschrijving]")
- 13:50, 21 March 2024 Floyd talk contribs created page Translations:Lexica/2/nl (Created page with "=== DiaMaNT === Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen woordvormen en betekeniseenheden (concepten) en plaatst z...")
- 13:48, 21 March 2024 Floyd talk contribs created page Translations:Lexica/1/nl (Created page with "== Eentalige Lexica ==")
- 13:47, 21 March 2024 Floyd talk contribs created page Translations:Lexica/Page display title/nl (Created page with "Lexica")
- 13:46, 21 March 2024 Floyd talk contribs marked Lexica for translation
- 13:36, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/40/nl (Created page with "* [http://gigacorpus.nl/ Project website] *")
- 13:36, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/39/nl (Created page with "== Dutch Gigacorpus == Met 234GB aan gevarieerde platte tekst, maarliefst 40 miljard tokens, is dit in ieder geval het grootste Nederlandse corpus. Maar daarnaast is dit corpus ook vrij beschikbaar en de kwaliteit is relatief hoog voor zijn omvang, zorg is gedragen voor het zo schoon mogelijk krijgen van de data. Ook bevat het corpus 400 miljoen forumposts in 10 miljoen threads met hun timestamp intact voor taalkundig onderzoek.")
- 13:35, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/38/nl (Created page with "*[https://data.statmt.org/cc-100/ Corpus website met downloadlinks per taal] *[https://www.aclweb.org/anthology/2020.acl-main.747 Paper webpagina] *[https://aclanthology.org/2020.lrec-1.494/ Paper webpagina]")
- 13:34, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/37/nl (Created page with "==CC-100 Corpus== Dit corpus is een poging om de dataset die wordt gebruikt voor het trainen van XLM-R opnieuw te creëren. Dit corpus bestaat uit eentalige data voor 100+ talen en bevat daarnaast data voor geromaniseerde talen (aangegeven door *_rom)")
- 13:25, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/36/nl (Created page with "==Named Entity Recognition CoNLL2002== Spaanse en Nederlandse data met named entity labels. De Nederlandse data bestaat uit vier edities van de Belgische krant 'De Morgen' uit 2000 (2 juni, 1 juli, 1 augustus en 1 september). Voor de Nederlandse data heeft de annotator zo goed als mogelijk de MITRE en SAIC-richtlijnen voor named entity recognition (Chinchor et al.,1999) gevolgd. *[https://huggingface.co/datasets/conll2002 CoNLL2002 Dataset]")
- 13:21, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/35/nl (Created page with "*[https://doi.org/10.5281/zenodo.1035175 Webpagina] *[https://doi.org/10.5281/zenodo.1035175 Paper]")
- 13:21, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/34/nl (Created page with "==Dutch Audio Description Corpus== Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. De data bestaat uit de corpusbestanden (XML-bestanden) van de getranscribeerde audiobeschrijvingen, de multimodale concordantie die is ontwikkeld voor het project en de rauwe data die is geëxtraheerd uit het corpus als onderdeel van het promo...")
- 13:15, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/33/nl (Created page with "*[https://huggingface.co/datasets/clips/mqa Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]")
- 13:15, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/32/nl (Created page with "==MQA (Multilingual corpus of Questions and Answers)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bestaat uit 234 miljoen paren van vragen en antwoorden in 39 verschillende talen.")
- 13:14, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/31/nl (Created page with "==VaccinChatNL== Een Belgisch-Nederlandse FAQ-dataset op het gebied van COVID-19-vaccinaties in Vlaanderen. Het bestaat uit 12.833 gebruikersvragen, verdeeld over 181 antwoord-labels, waarmee het grote groepen semantisch gelijkwaardige parafrases aanbiedt. VaccinChatNL is de eerste Nederlandse Dutch FAQ dataset van deze grootte. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2022.coling-1.312 Paper]")
- 13:07, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/30/nl (Created page with "==MFAQ (Multilingual corpus of Frequently Asked Questions)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bevat zes miljoen paren van vragen en antwoorden in 21 verschillende talen. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]")
- 13:04, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/29/nl (Created page with "*[https://lt3.ugent.be/resources/multimodal-abea/ Informatiepagina] *[https://lt3.ugent.be/media/uploads/tools/Dataset.zip Download]")
- 13:04, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/28/nl (Created page with "== Multimodal ABEA == Multimodale dataset die kan worden gebruikt binnen de context van aspect-based sentiment-en emotieherkenning. Het bestaat uit 4.900 opmerkingen op 175 afbeeldingen op de Adidas Instagram-pagina en is geannoteerd met zowel aspect als emotielabels.")
- 12:58, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/27/nl (Created page with "*[https://github.com/LanguageMachines/JASMIN-BLISS-Negation Webpagina]")
- 12:58, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/26/nl (Created page with "==JASMIN-BLISS-Negation== Een corpusvoorbeeld van Nederlandse mens-machinedialogen, geannoteerde met ontkenningssignalen.")
- 12:55, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/25/nl (Created page with "*[https://zenodo.org/record/4643756#.Yl6GBehBzZQ Download pagina]")
- 12:55, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/24/nl (Created page with "==Personae Corpus== Het Personae-corpus is verzameld voor experimenten in 'Authorship Attribution and Personality Prediction'. Het bestaat uit 145 Nederlandstalige essays, geschreven door 145 verschillende studenten (BA in taalkunde en literatuur aan de Universiteit van Antwerpen, België). Elke student deed ook een online MBTI-persoonlijkheidstest, wat persoonlijkheidsvoorspellingsexperimenten mogelijk maakt. Het corpus is gecontroleerd op onderwerp, register, genre, le...")
- 12:47, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/23/nl (Created page with "* Versie 1.1 (2020) *[http://hdl.handle.net/10032/tm-a2-r6 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/NAMES-corpus-1.1-manual.pdf Documentatie]")
- 12:46, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/42/nl (Created page with "Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaand...")
- 12:46, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/22/nl (Created page with "==NAMES Corpus ==")
- 12:45, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/21/nl (Created page with "* Versie 1.0 (2018) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/Methodology.pdf Methodologie] *[http://hdl.handle.net/10032/tm-a2-r7 Download pagina]")
- 12:45, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/41/nl (Created page with "Een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatsche uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van de uitdrukkingen kenden.")
- 12:44, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/20/nl (Created page with "==Dutch Idiom Database: Native Speakers (DID-NS)==")
- 12:43, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/19/nl (Created page with "* [https://zenodo.org/record/4643731#.YgKUSurMLZR Download pagina]")
- 12:43, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/18/nl (Created page with "==deLearyous== De deLearyous dataset is een Nederlands (Vlaamse) dataset voor emotieclassificatie volgens het framework van Leary's Rose, beter bekend als het Interpersonal Circumplex. De dataset bestaat uit 11 gesprekken die zijn geannoteerd op zinsniveau met hun positie op Leary's Rose, in functie van de twee kenmerkende dimensies: 'dominantie', en 'affiniteit'.")
- 12:37, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/17/nl (Created page with "* [https://zenodo.org/record/1035175#.YfP7IerMLZR Download pagina]")
- 12:37, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/16/nl (Created page with "== Dutch Audio Description Corpus == Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Dit Dutch AD corpus is gebruikt om een reeks kwantitatieve data betreffende de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals...")
- 12:27, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/15/nl (Created page with "*[https://benjaminvdb.github.io/DBRD/ Homepagina] *[https://github.com/benjaminvdb/DBRD GitHub]")
- 12:27, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/14/nl (Created page with "==DBRD== De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentiment polariteitslabels. Het is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering. Daarnaast kan het worden gebruikt om een model te trainen voor tekstclassificatie, in het specifiek sentimentclassifica...")
- 11:41, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/13/nl (Created page with "*versie 1.0 (2009) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/dtuna_documentatie_en.pdf Paper] *[http://hdl.handle.net/10032/tm-a2-k5 Download pagina]")
- 11:40, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/12/nl (Created page with "==D-Tuna-corpus== Het D-TUNA Corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële uitdrukkingen.")
- 11:37, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/11/nl (Created page with "*versie 1.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/corea_lrec08_en.pdf Paper] *[https://corea.tst-centrale.org/ Demo] *[http://hdl.handle.net/10032/tm-a2-f9 Download pagina]")
- 11:36, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/10/nl (Created page with "==COREA-coreferentiecorpus== Het COREA-coreferentiecorpus is een corpus van Nederlandse teksten die zijn geannoteerd met coreferentierelaties.")
- 11:34, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/9/nl (Created page with "* [https://neon.niederlandistik.fu-berlin.de/static/digitaal/digitaal-11.html Corpus website]")
- 11:34, 21 March 2024 Floyd talk contribs created page Translations:Other corpora/8/nl (Created page with "==CONDIV-corpus== Het CONDIV-corpus is een elektronisch toegankelijke, regionaal, stilistisch en diachroon gecontroleerde materiaalverzameling van ongeveer 47.000.000 woorden geschreven Nederlands, die speciaal ten behoeve van het CONDIV-project ontwikkeld werd. Om toegang te krijgen tot de data, dient u contact op te nemen met [https://www.kuleuven.be/wieiswie/nl/person/00013279 Dirk Speelman van de KU Leuven]")
- 11:27, 21 March 2024 Floyd talk contribs marked Other corpora for translation