Manually annotated corpora/nl: Revision history

Jump to navigation Jump to search

Diff selection: Mark the radio buttons of the revisions to compare and hit enter or the button at the bottom.
Legend: (cur) = difference with latest revision, (prev) = difference with preceding revision, m = minor edit.

18 April 2024

3 April 2024

29 March 2024

26 March 2024

18 March 2024

  • curprev 16:1016:10, 18 March 2024Floyd talk contribs 8,651 bytes −53 Created page with "[https://doi.org/10.1007/s10579-023-09700-0 Labat, S., Demeester, T., & Hoste, V. (2023). EmoTwiCS : a corpus for modelling emotion trajectories in Dutch customer service dialogues on Twitter.] [https://aclanthology.org/2022.wnut-1.12/ Labat, S., Hadifar, A., Demeester, T., & Hoste, V. (2022). An emotional journey : detecting emotion trajectories in Dutch customer service dialogues] [https://lt3.ugent.be/resources/emotwics/dataset-download-form/ Vraag om toegang]"
  • curprev 16:0916:09, 18 March 2024Floyd talk contribs 8,704 bytes −50 Created page with "==EmoTwiCS== EmoTwiCS is een corpus van 9,489 Nederlandse klantenservice dialogen die zijn verzameld via Twitter."
  • curprev 16:0816:08, 18 March 2024Floyd talk contribs 8,754 bytes −54 Created page with "* [https://lt3.ugent.be/resources/emowoz-cs-en-nl/ Project pagina] * Labat, S., Ackaert, N., Demeester, T., & Hoste, V. (2022). Variation in the Expression and Annotation of Emotions: a Wizard of Oz Pilot Study. In G. Abercrombie, V. Basile, S. Tonelli, V. Rieser, & A. Uma (Eds.), Proceedings of the 1st Workshop on Perspectivist Approaches to NLP @LREC2022 (pp. 66–72). Marseille, France: European Language Resources Association (ELRA)"
  • curprev 16:0716:07, 18 March 2024Floyd talk contribs 8,808 bytes +49 Created page with "* De Bruyne, L., De Clercq, O., & Hoste, V. (2021). Prospects for Dutch emotion detection: Insights from the new EmotioNL dataset. Computational Linguistics in the Netherlands Journal, 11, 231-255. * [https://lt3.ugent.be/resources/emotionl/ Info pagina (onder andere betreffende de toegang tot de corpusdata)] ==EEmoWOZ-CS EN-NL== Het EmoWOZ-corpus is een tekstuele conversationele corpus in het domein van de klantenservice, verzameld doormiddel van de Wizard of Oz-techn..."
  • curprev 15:3515:35, 18 March 2024Floyd talk contribs 8,759 bytes −3 Created page with "==EmotioNL== Het EmotioNL-corpus is een emotie-geannoteerde corpus van Nederlandse teksten. Het bestaat uit 1,000 Nederlandse tweets en 1,000 citaten uit reality TV-shows. De teksten zijn geannoteerd met de categorieën woede, angst, genot, liefde, verdriet en neutraal, en scores (Reëelwaardig gewaardeerd, tussen 0 en 1) voor de emotionele dimensievalentie, opwinding en dominantie."
  • curprev 15:2315:23, 18 March 2024Floyd talk contribs 8,762 bytes −38 Created page with "* [https://lt3.ugent.be/media/uploads/publications/2019/8605796.pdf EventDNA: Annotation Guidelines forEntities and Events in Dutch News Texts (v1.0) Camiel Colruyt, Orphée De Clercq and Véronique Hoste] * [https://github.com/NewsDNA-LT3/.github Code voor de gebeurtenisextractie-experimenten en IAA-onderzoek] * [https://lt3.ugent.be/resources/eventdna-corpus/ Info pagina (onder andere betreffende de toegang tot de corpusdata)]"
  • curprev 15:1215:12, 18 March 2024Floyd talk contribs 8,800 bytes −42 Created page with "==EventDNA== Het EventDNA-corpus is een Nederlandstalig corpus bestaand uit 1,773 nieuwsdocumenten waarin nieuwsgebeurtenissen, entiteiten, IPTC Media Topic codes en coreferentie-links handmatig zijn geannoteerd."
  • curprev 15:0815:08, 18 March 2024Floyd talk contribs 8,842 bytes −73 Created page with "* [https://lt3.ugent.be/media/uploads/tools/Translated_corpus_and_guidelines_ETdhZnZ.zip Download link] * Bauwelinck, N., & Lefever, E. (2020, December). Annotating Topics, Stance, Argumentativeness and Claims in Dutch Social Media Comments: A Pilot Study. In Proceedings of the 7th Workshop on Argument Mining (pp. 8-18)."
  • curprev 14:2914:29, 18 March 2024Floyd talk contribs 8,915 bytes −54 Created page with "* [https://github.com/margotfonteyne/StylesNMT Download pagina] * Tezcan, A., Hoste, V., & Macken, L. (2017). SCATE taxonomy and corpus of machine translation errors. In G. C. Pastor & I. Durán-Muñoz (Eds.), Trends in E-tools and resources for translators and interpreters (Vol. 45, pp. 219–244). Brill | Rodopi."
  • curprev 14:2814:28, 18 March 2024Floyd talk contribs 8,969 bytes −35 Created page with "==StylesNMT== Deze datacollectie bevat een Engels-Nederlandse machinevertaling van de detectiveroman "The Mysterious Affair at Styles" van Agatha Christie. De vertaling is gegenereerd in mei van 2019 door Google's Neural Machine Translation (GNMT) systeem. De complete roman (5,276 zinsparen) is handmatig geannoteerd met vertaalfouten, met gebruik van een aangepaste versie van de SCATE MT error taxonomy (Tezcan et al. 2017)."

14 March 2024

  • curprev 15:1915:19, 14 March 2024Floyd talk contribs 9,004 bytes −55 Created page with "==ACTER: Annotated Corpora for Term Extraction Research== ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie)."
  • curprev 15:1315:13, 14 March 2024Floyd talk contribs 9,059 bytes −8 Created page with "==Eindhoven Corpus== Het Eindhoven-corpus is de eerste verzameling van Nederlandstalige geschreven en (getranscribeerde) gesproken teksten die voor onderzoeksdoeleinden is gemaakt. Het corpus dateert uit de periode 1960-1973 en bevat ongeveer 768.000 tekens."
  • curprev 15:0915:09, 14 March 2024Floyd talk contribs 9,067 bytes −292 Created page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/sonar_verschillendecorpora.txt Verscheidene versies van het SoNaR Corpus] * [http://hdl.handle.net/10032/tm-a2-m9 Download pagina]"
  • curprev 14:5114:51, 14 March 2024Floyd talk contribs 9,359 bytes −594 No edit summary
  • curprev 14:4114:41, 14 March 2024Floyd talk contribs 9,953 bytes +19 Created page with "Handmatige corpora zijn verzamelingen van teksten die handmatig gevalideerde of handmatig aangebrachte taalkundige informatie bevatten, zoals morfosyntactische tags, lemma's, syntactische parseringen, named entities etc. Deze corpora kunnen worden gebruikt bij het trainen van nieuwe taalannotatiehulpmiddelen, als ook bij het testen van de nauwkeurigheid van bestaande annotatiehulpmiddelen."
  • curprev 14:3114:31, 14 March 2024Floyd talk contribs 9,934 bytes +9,934 Created page with "Handmatig geannoteerde corpora"