User contributions for Floyd
Jump to navigation
Jump to search
21 March 2024
- 13:1713:17, 21 March 2024 diff hist −180 Other corpora/nl Created page with "==MQA (Multilingual corpus of Questions and Answers)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bestaat uit 234 miljoen paren van vragen en antwoorden in 39 verschillende talen."
- 13:1513:15, 21 March 2024 diff hist +102 N Translations:Other corpora/33/nl Created page with "*[https://huggingface.co/datasets/clips/mqa Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]" current
- 13:1513:15, 21 March 2024 diff hist +206 N Translations:Other corpora/32/nl Created page with "==MQA (Multilingual corpus of Questions and Answers)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bestaat uit 234 miljoen paren van vragen en antwoorden in 39 verschillende talen." current
- 13:1413:14, 21 March 2024 diff hist +465 N Translations:Other corpora/31/nl Created page with "==VaccinChatNL== Een Belgisch-Nederlandse FAQ-dataset op het gebied van COVID-19-vaccinaties in Vlaanderen. Het bestaat uit 12.833 gebruikersvragen, verdeeld over 181 antwoord-labels, waarmee het grote groepen semantisch gelijkwaardige parafrases aanbiedt. VaccinChatNL is de eerste Nederlandse Dutch FAQ dataset van deze grootte. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2022.coling-1.312 Paper]"
- 13:0913:09, 21 March 2024 diff hist −53 Other corpora/nl Created page with "Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaand..."
- 13:0713:07, 21 March 2024 diff hist +337 N Translations:Other corpora/30/nl Created page with "==MFAQ (Multilingual corpus of Frequently Asked Questions)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bevat zes miljoen paren van vragen en antwoorden in 21 verschillende talen. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]" current
- 13:0613:06, 21 March 2024 diff hist −94 Other corpora/nl Created page with "==JASMIN-BLISS-Negation== Een corpusvoorbeeld van Nederlandse mens-machinedialogen, geannoteerde met ontkenningssignalen."
- 13:0413:04, 21 March 2024 diff hist +132 N Translations:Other corpora/29/nl Created page with "*[https://lt3.ugent.be/resources/multimodal-abea/ Informatiepagina] *[https://lt3.ugent.be/media/uploads/tools/Dataset.zip Download]" current
- 13:0413:04, 21 March 2024 diff hist +268 N Translations:Other corpora/28/nl Created page with "== Multimodal ABEA == Multimodale dataset die kan worden gebruikt binnen de context van aspect-based sentiment-en emotieherkenning. Het bestaat uit 4.900 opmerkingen op 175 afbeeldingen op de Adidas Instagram-pagina en is geannoteerd met zowel aspect als emotielabels."
- 13:0113:01, 21 March 2024 diff hist −94 Other corpora/nl Created page with "* Versie 1.1 (2020) *[http://hdl.handle.net/10032/tm-a2-r6 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/NAMES-corpus-1.1-manual.pdf Documentatie]"
- 12:5812:58, 21 March 2024 diff hist +70 N Translations:Other corpora/27/nl Created page with "*[https://github.com/LanguageMachines/JASMIN-BLISS-Negation Webpagina]" current
- 12:5812:58, 21 March 2024 diff hist +121 N Translations:Other corpora/26/nl Created page with "==JASMIN-BLISS-Negation== Een corpusvoorbeeld van Nederlandse mens-machinedialogen, geannoteerde met ontkenningssignalen." current
- 12:5512:55, 21 March 2024 diff hist −55 Other corpora/nl Created page with "Een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatsche uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van de uitdrukkingen kenden."
- 12:5512:55, 21 March 2024 diff hist +65 N Translations:Other corpora/25/nl Created page with "*[https://zenodo.org/record/4643756#.Yl6GBehBzZQ Download pagina]"
- 12:5512:55, 21 March 2024 diff hist +609 N Translations:Other corpora/24/nl Created page with "==Personae Corpus== Het Personae-corpus is verzameld voor experimenten in 'Authorship Attribution and Personality Prediction'. Het bestaat uit 145 Nederlandstalige essays, geschreven door 145 verschillende studenten (BA in taalkunde en literatuur aan de Universiteit van Antwerpen, België). Elke student deed ook een online MBTI-persoonlijkheidstest, wat persoonlijkheidsvoorspellingsexperimenten mogelijk maakt. Het corpus is gecontroleerd op onderwerp, register, genre, le..."
- 12:5112:51, 21 March 2024 diff hist +377 Other corpora/nl Created page with "==deLearyous== De deLearyous dataset is een Nederlands (Vlaamse) dataset voor emotieclassificatie volgens het framework van Leary's Rose, beter bekend als het Interpersonal Circumplex. De dataset bestaat uit 11 gesprekken die zijn geannoteerd op zinsniveau met hun positie op Leary's Rose, in functie van de twee kenmerkende dimensies: 'dominantie', en 'affiniteit'."
- 12:4712:47, 21 March 2024 diff hist +184 N Translations:Other corpora/23/nl Created page with "* Versie 1.1 (2020) *[http://hdl.handle.net/10032/tm-a2-r6 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/NAMES-corpus-1.1-manual.pdf Documentatie]"
- 12:4612:46, 21 March 2024 diff hist +775 N Translations:Other corpora/42/nl Created page with "Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaand..." current
- 12:4612:46, 21 March 2024 diff hist +17 N Translations:Other corpora/22/nl Created page with "==NAMES Corpus ==" current
- 12:4512:45, 21 March 2024 diff hist +172 N Translations:Other corpora/21/nl Created page with "* Versie 1.0 (2018) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/Methodology.pdf Methodologie] *[http://hdl.handle.net/10032/tm-a2-r7 Download pagina]"
- 12:4512:45, 21 March 2024 diff hist +342 N Translations:Other corpora/41/nl Created page with "Een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatsche uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van de uitdrukkingen kenden." current
- 12:4412:44, 21 March 2024 diff hist +50 N Translations:Other corpora/20/nl Created page with "==Dutch Idiom Database: Native Speakers (DID-NS)==" current
- 12:4312:43, 21 March 2024 diff hist +66 N Translations:Other corpora/19/nl Created page with "* [https://zenodo.org/record/4643731#.YgKUSurMLZR Download pagina]"
- 12:4312:43, 21 March 2024 diff hist +366 N Translations:Other corpora/18/nl Created page with "==deLearyous== De deLearyous dataset is een Nederlands (Vlaamse) dataset voor emotieclassificatie volgens het framework van Leary's Rose, beter bekend als het Interpersonal Circumplex. De dataset bestaat uit 11 gesprekken die zijn geannoteerd op zinsniveau met hun positie op Leary's Rose, in functie van de twee kenmerkende dimensies: 'dominantie', en 'affiniteit'." current
- 12:4112:41, 21 March 2024 diff hist −69 Other corpora/nl Created page with "== Dutch Audio Description Corpus == Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Dit Dutch AD corpus is gebruikt om een reeks kwantitatieve data betreffende de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals..."
- 12:3712:37, 21 March 2024 diff hist +66 N Translations:Other corpora/17/nl Created page with "* [https://zenodo.org/record/1035175#.YfP7IerMLZR Download pagina]"
- 12:3712:37, 21 March 2024 diff hist +610 N Translations:Other corpora/16/nl Created page with "== Dutch Audio Description Corpus == Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Dit Dutch AD corpus is gebruikt om een reeks kwantitatieve data betreffende de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals..."
- 12:2812:28, 21 March 2024 diff hist −33 Other corpora/nl Created page with "==DBRD== De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentiment polariteitslabels. Het is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering. Daarnaast kan het worden gebruikt om een model te trainen voor tekstclassificatie, in het specifiek sentimentclassifica..."
- 12:2712:27, 21 March 2024 diff hist +95 N Translations:Other corpora/15/nl Created page with "*[https://benjaminvdb.github.io/DBRD/ Homepagina] *[https://github.com/benjaminvdb/DBRD GitHub]" current
- 12:2712:27, 21 March 2024 diff hist +558 N Translations:Other corpora/14/nl Created page with "==DBRD== De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentiment polariteitslabels. Het is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering. Daarnaast kan het worden gebruikt om een model te trainen voor tekstclassificatie, in het specifiek sentimentclassifica..."
- 11:4411:44, 21 March 2024 diff hist +191 Other corpora/nl Created page with "==CONDIV-corpus== Het CONDIV-corpus is een elektronisch toegankelijke, regionaal, stilistisch en diachroon gecontroleerde materiaalverzameling van ongeveer 47.000.000 woorden geschreven Nederlands, die speciaal ten behoeve van het CONDIV-project ontwikkeld werd. Om toegang te krijgen tot de data, dient u contact op te nemen met [https://www.kuleuven.be/wieiswie/nl/person/00013279 Dirk Speelman van de KU Leuven]"
- 11:4111:41, 21 March 2024 diff hist +174 N Translations:Other corpora/13/nl Created page with "*versie 1.0 (2009) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/dtuna_documentatie_en.pdf Paper] *[http://hdl.handle.net/10032/tm-a2-k5 Download pagina]"
- 11:4111:41, 21 March 2024 diff hist +205 Translations:Other corpora/12/nl No edit summary
- 11:4111:41, 21 March 2024 diff hist +174 Translations:Other corpora/10/nl No edit summary current
- 11:4011:40, 21 March 2024 diff hist +124 N Translations:Other corpora/12/nl Created page with "==D-Tuna-corpus== Het D-TUNA Corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële uitdrukkingen."
- 11:3711:37, 21 March 2024 diff hist +210 N Translations:Other corpora/11/nl Created page with "*versie 1.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/corea_lrec08_en.pdf Paper] *[https://corea.tst-centrale.org/ Demo] *[http://hdl.handle.net/10032/tm-a2-f9 Download pagina]"
- 11:3611:36, 21 March 2024 diff hist +142 N Translations:Other corpora/10/nl Created page with "==COREA-coreferentiecorpus== Het COREA-coreferentiecorpus is een corpus van Nederlandse teksten die zijn geannoteerd met coreferentierelaties."
- 11:3511:35, 21 March 2024 diff hist −39 Other corpora/nl Created page with "* [https://neon.niederlandistik.fu-berlin.de/static/digitaal/digitaal-11.html Corpus website]"
- 11:3411:34, 21 March 2024 diff hist +93 N Translations:Other corpora/9/nl Created page with "* [https://neon.niederlandistik.fu-berlin.de/static/digitaal/digitaal-11.html Corpus website]"
- 11:3411:34, 21 March 2024 diff hist +414 N Translations:Other corpora/8/nl Created page with "==CONDIV-corpus== Het CONDIV-corpus is een elektronisch toegankelijke, regionaal, stilistisch en diachroon gecontroleerde materiaalverzameling van ongeveer 47.000.000 woorden geschreven Nederlands, die speciaal ten behoeve van het CONDIV-project ontwikkeld werd. Om toegang te krijgen tot de data, dient u contact op te nemen met [https://www.kuleuven.be/wieiswie/nl/person/00013279 Dirk Speelman van de KU Leuven]" current
- 11:2711:27, 21 March 2024 diff hist +24 Other corpora Marked this version for translation
- 11:2511:25, 21 March 2024 diff hist +393 Other corpora No edit summary
- 11:1011:10, 21 March 2024 diff hist +22 Other corpora/nl No edit summary
- 11:1011:10, 21 March 2024 diff hist −1 Translations:Other corpora/3/nl No edit summary current
- 11:0911:09, 21 March 2024 diff hist +23 Translations:Other corpora/3/nl No edit summary
- 11:0911:09, 21 March 2024 diff hist −1 Other corpora No edit summary
- 11:0611:06, 21 March 2024 diff hist +19 Other corpora/nl No edit summary
- 11:0411:04, 21 March 2024 diff hist +19 Translations:Other corpora/1/nl No edit summary current
- 11:0411:04, 21 March 2024 diff hist +1 Other corpora No edit summary
- 11:0211:02, 21 March 2024 diff hist +1 Other corpora No edit summary