User contributions for Floyd

A user with 1,253 edits. Account created on 5 March 2024.
Jump to navigation Jump to search
Search for contributionsExpandCollapse
⧼contribs-top⧽
⧼contribs-date⧽
(newest | oldest) View ( | ) (20 | 50 | 100 | 250 | 500)

26 March 2024

  • 11:4811:48, 26 March 2024 diff hist +65 N Translations:Wordlists/15/nlCreated page with "*[https://zenodo.org/record/2402048#.YjikzjXvJNZ Download pagina]"
  • 11:4811:48, 26 March 2024 diff hist +453 N Translations:Wordlists/14/nlCreated page with "== Middle Dutch syllabified words== Deze woordenlijst bevat 43.710 gesyllabificeerde Middelnederlandse woorden. Dit is het totale aantal unieke woorden uit het corpus van Van Reenen-Mulder. Dit corpus, gecreëerd door Pieter van Reenen en Maaike Mulder aan de Vrije Universiteit Amsterdam bevat ongeveer 2.500 Middelnederlandse kaarten. Het heeft ongeveer 750,000 tokens. De kaarten werden geschreven in het Nederlands en het Vlaams tussen 1300 en 1400."
  • 11:3511:35, 26 March 2024 diff hist −72 Wordlists/nlCreated page with "* [http://crr.ugent.be/programs-data/subtitle-frequencies/subtlex-nl Project pagina] * [https://osf.io/3d8cx/ Download pagina] * Reference: Keuleers, E., Brysbaert, M. & New, B. (2010). SUBTLEX-NL: A new frequency measure for Dutch words based on film subtitles. Behavior Research Methods, 42(3), 643-650."
  • 11:3411:34, 26 March 2024 diff hist +76 N Translations:Wordlists/13/nlCreated page with "* Versie 1.0 (2019) * [http://hdl.handle.net/10032/tm-a2-p6 Download pagina]"
  • 11:3411:34, 26 March 2024 diff hist +396 N Translations:Wordlists/12/nlCreated page with "N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten, tijdschriften, journaaluitzendingen en juridisch materiaal. CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende absolute frequentie." current
  • 11:3311:33, 26 March 2024 diff hist +17 N Translations:Wordlists/11/nlCreated page with "== CHN N-grams ==" current
  • 11:3211:32, 26 March 2024 diff hist +209 N Translations:Wordlists/10/nlCreated page with "* [https://cordis.europa.eu/project/id/215064 Project informatie] * [http://hdl.handle.net/10032/tm-a2-a6 Download pagina] * [https://ivdnt.org/images/stories/producten/Does-Depuydt-2012_v6.pdf Evaluatiepaper]"
  • 11:3211:32, 26 March 2024 diff hist +213 N Translations:Wordlists/9/nlCreated page with "== INT Historische Woordenlijst == De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970."
  • 11:3111:31, 26 March 2024 diff hist +164 N Translations:Wordlists/8/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/clex_documentatie_en.pdf Documentatie] * [http://hdl.handle.net/10032/tm-a2-k2 Download pagina]"
  • 11:3111:31, 26 March 2024 diff hist +303 N Translations:Wordlists/7/nlCreated page with "==CombiLex== CombiLex is een lijst van woorden en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508."
  • 11:3111:31, 26 March 2024 diff hist +305 N Translations:Wordlists/6/nlCreated page with "* [http://crr.ugent.be/programs-data/subtitle-frequencies/subtlex-nl Project pagina] * [https://osf.io/3d8cx/ Download pagina] * Reference: Keuleers, E., Brysbaert, M. & New, B. (2010). SUBTLEX-NL: A new frequency measure for Dutch words based on film subtitles. Behavior Research Methods, 42(3), 643-650."
  • 11:3011:30, 26 March 2024 diff hist +142 N Translations:Wordlists/5/nlCreated page with "== Subtlex NL == SUBTLEX-NL is een database van Nederlandse woordfrequenties gebaseerd op 44 miljoen woorden uit film-en televisieondertitels."
  • 11:2511:25, 26 March 2024 diff hist −101 Wordlists/nlCreated page with "Aan het einde van 2015 bestond de Woordenlijst van de Nederlandse Taal uit meer dan 180.000 trefwoorden. In de online versie van de Woordenlijst (woordenlijst.org) kunnen deze woorden allemaal worden gevonden, met bijgevoegde data over bijv. woordafbrekingen en vervoegingen."
  • 11:2511:25, 26 March 2024 diff hist +48 N Translations:Wordlists/4/nlCreated page with "* [https://woordenlijst.org/#/ Woordenlijst.org]" current
  • 11:2411:24, 26 March 2024 diff hist +275 N Translations:Wordlists/3/nlCreated page with "Aan het einde van 2015 bestond de Woordenlijst van de Nederlandse Taal uit meer dan 180.000 trefwoorden. In de online versie van de Woordenlijst (woordenlijst.org) kunnen deze woorden allemaal worden gevonden, met bijgevoegde data over bijv. woordafbrekingen en vervoegingen." current
  • 11:2011:20, 26 March 2024 diff hist +564 N Translations:Wordlists/2/nlCreated page with "Sinds 1804 wordt de Nederlandse spelling bepaald door de overheid. Dit omvat standaardprincipes en specifieke regels, zoals de spelling van klinkers en medeklinkers, het gebruik van hoofdletters en tekens (accenten, koppeltekens, interpunctietekens en apostrofs), de spelling van samenstellingen met een midden klank en de scheiding van woorden in lettergrepen. Daarnaast publiceert de overheid een lijst van woorden die zijn gespeld volgens de regels en anderen die moeilijk..."
  • 11:0511:05, 26 March 2024 diff hist +42 N Translations:Wordlists/1/nlCreated page with "== Woordenlijst van de Nederlandse Taal ==" current
  • 11:0511:05, 26 March 2024 diff hist +14 N Translations:Wordlists/Page display title/nlCreated page with "Woordenlijsten" current
  • 11:0511:05, 26 March 2024 diff hist +243 WordlistsMarked this version for translation
  • 11:0411:04, 26 March 2024 diff hist +25 WordlistsNo edit summary
  • 11:0211:02, 26 March 2024 diff hist +14 Conceptual ResourcesNo edit summary
  • 11:0211:02, 26 March 2024 diff hist −102 Conceptual Resources/nlCreated page with "== Dutch SemCor == Dutch SemCor biedt een corpus, volledig sense-tagged met senses en domain tags uit de Cornetto database *[http://wordpress.let.vupr.nl/dutchsemcor/ Project website] *[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download menselijke annotaties] *[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine-annotaties]"
  • 11:0211:02, 26 March 2024 diff hist +115 N Translations:Conceptual Resources/14/nlCreated page with "== Datasets voor psychologisch onderzoek == https://www.ugent.be/pp/experimentele-psychologie/en/research/documents" current
  • 11:0111:01, 26 March 2024 diff hist +1 Translations:Conceptual Resources/13/nlNo edit summary
  • 11:0111:01, 26 March 2024 diff hist +733 N Translations:Conceptual Resources/13/nlCreated page with "== Concreteness Data == In navolging van gelijksoortige onderzoeken in het Engels, woorden voor 30.000 Nederlandse woorden de ratings van 'concreteness' gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waar taalonderzoekers waarschijnlijk in geïnteresseerd zijn *[http://crr.ugent.be/papers/Concreteness%20ratings%20Brysbaert%20et%20al.xlsx Concreteness norms] (links werken niet meer) *[http://crr.ugent.be/archives/1602 Website] *[http://crr.ugent.be/papers/..."
  • 10:5810:58, 26 March 2024 diff hist +473 N Translations:Conceptual Resources/12/nlCreated page with "*[https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/aoa/appnet.htm Data download] *[http://crr.ugent.be/archives/1602 Website] (functioneert niet meer) *[https://www.researchgate.net/publication/262385555_Norms_of_age_of_acquisition_and_concreteness_for_30000_Dutch_words Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]"
  • 10:5710:57, 26 March 2024 diff hist +291 N Translations:Conceptual Resources/11/nlCreated page with "== Age of Acquisition Data == In navolging van gelijksoortige onderzoeken in het Engels, worden voor 30.000 Nederlandse woorden de ratings van de 'age-of-acquisition' gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waar taalonderzoekers waarschijnlijk in geïnteresseerd zijn."
  • 10:5210:52, 26 March 2024 diff hist −119 Conceptual Resources/nlCreated page with "*[https://smallworldofwords.org/en/project/research#download Data download] *[https://smallworldofwords.org/articles/2012.DeDeyneNavarroStorms.Wordassociations.BRM.pdf De Deyne, S., Navarro, D., Storms, G. (2013). Better explanations of lexical and semantic cognition using networks derived from continued rather than single word associations. Behavior Research Methods, 45 (2), 480-498.]"
  • 10:5010:50, 26 March 2024 diff hist +388 N Translations:Conceptual Resources/10/nlCreated page with "*[https://smallworldofwords.org/en/project/research#download Data download] *[https://smallworldofwords.org/articles/2012.DeDeyneNavarroStorms.Wordassociations.BRM.pdf De Deyne, S., Navarro, D., Storms, G. (2013). Better explanations of lexical and semantic cognition using networks derived from continued rather than single word associations. Behavior Research Methods, 45 (2), 480-498.]"
  • 10:5010:50, 26 March 2024 diff hist +186 N Translations:Conceptual Resources/9/nlCreated page with "== Woordassociatie Data == Woordassociatie en deelnemersdata voor 100 primaire, secundaire en tertiaire antwoorden op 12.571 cues zoals beschreven in De Deyne, Navarro and Storms (2013)." current
  • 10:4710:47, 26 March 2024 diff hist +373 N Translations:Conceptual Resources/8/nlCreated page with "* [https://omwn.org/omw1.html OMW Version 1] verbindt handmatige gecreëerde wordnets en automatisch gecreëerde wordnets voor meer dan 150 talen met behulp van het Princeton Wordnet van het Engels. * [https://omwn.org/omw2.html OMW Version 2], de huidige (experimentele) versie, die gebruikmaakt van de Collaborative Interlingual Index om wordnets aan elkaar te verbinden."
  • 10:4410:44, 26 March 2024 diff hist −141 Conceptual Resources/nlCreated page with "== Open Multilingual WordNet == Het doel van dit project is om het gemakkelijk te maken om wordnets te gebruiken in meerdere talen. Er zijn momenteel twee versies van het OMW."
  • 10:4310:43, 26 March 2024 diff hist +175 N Translations:Conceptual Resources/7/nlCreated page with "== Open Multilingual WordNet == Het doel van dit project is om het gemakkelijk te maken om wordnets te gebruiken in meerdere talen. Er zijn momenteel twee versies van het OMW." current
  • 10:3910:39, 26 March 2024 diff hist +150 N Translations:Conceptual Resources/6/nlCreated page with "*[http://catalog.elra.info/en-us/repository/browse/ELRA-M0016/ Informatie] *[http://catalog.elra.info/en-us/purchase-procedure-info/ Aankoopprocedure]" current
  • 10:3910:39, 26 March 2024 diff hist +473 N Translations:Conceptual Resources/5/nlCreated page with "== EuroWordNet Nederlands == EuroWordNet is een meertalige databese met wordnets voor verscheidene Europese talen (Nederlands, Italiaans, Spaans, Frans, Tsjechisch en Ests). De wordnets zijn op dezelfde wijze gestructureerd als het Amerikaanse wordnet voor het Engels (Princeton WordNet, Miller et al 1990) wat betreft synsets (synoniemensets) met standaard semantische relaties tussen hen. Elk wordnet vertegenwoordigt een uniek taal-intrinsiek systeem van lexicalisaties."
  • 10:3810:38, 26 March 2024 diff hist −55 Conceptual Resources/nlCreated page with "*[http://cornetto.clarin.inl.nl/index.html Online demo] *[http://wordpress.let.vupr.nl/cornetto/ Project website]"
  • 10:2910:29, 26 March 2024 diff hist +398 N Translations:Conceptual Resources/4/nlCreated page with "== Dutch SemCor == Dutch SemCor biedt een corpus, volledig sense-tagged met senses en domain tags uit de Cornetto database *[http://wordpress.let.vupr.nl/dutchsemcor/ Project website] *[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download menselijke annotaties] *[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine-annotaties]"
  • 10:2710:27, 26 March 2024 diff hist −99 Conceptual Resources/nlCreated page with "== Open Dutch Wordnet == Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. *[http://wordpress.let.vupr.nl/odwn/ Project website]"
  • 10:2010:20, 26 March 2024 diff hist +113 N Translations:Conceptual Resources/3/nlCreated page with "*[http://cornetto.clarin.inl.nl/index.html Online demo] *[http://wordpress.let.vupr.nl/cornetto/ Project website]"
  • 10:2010:20, 26 March 2024 diff hist +839 N Translations:Conceptual Resources/2/nlCreated page with "== Cornetto-LMF (Lexicon Markup Framework) == Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert. Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Nederlands Referentie Lexicon, dat woorden ordent in vorm-betekenis units (lexicale invoergegevens) en beschrijft met korte definities, gebruiksbeperkingen..."
  • 10:0310:03, 26 March 2024 diff hist +170 N Translations:Conceptual Resources/1/nlCreated page with "== Open Dutch Wordnet == Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. *[http://wordpress.let.vupr.nl/odwn/ Project website]"
  • 10:0210:02, 26 March 2024 diff hist +19 N Translations:Conceptual Resources/Page display title/nlCreated page with "Conceptuele bronnen" current
  • 10:0110:01, 26 March 2024 diff hist +159 Conceptual ResourcesMarked this version for translation
  • 10:0110:01, 26 March 2024 diff hist +25 Conceptual ResourcesNo edit summary
  • 09:5609:56, 26 March 2024 diff hist 0 DictionariesNo edit summary current
  • 09:5509:55, 26 March 2024 diff hist +1 DictionariesNo edit summary
  • 09:5509:55, 26 March 2024 diff hist −89 Dictionaries/nlCreated page with "*[https://www.vandale.nl/ Van Dale online]"
  • 09:5509:55, 26 March 2024 diff hist +12 DictionariesNo edit summary
  • 09:5509:55, 26 March 2024 diff hist +52 N Translations:Dictionaries/38/nlCreated page with "* [http://www.dictionaryportal.eu/nl/ Online zoeken]" current
  • 09:5409:54, 26 March 2024 diff hist +277 N Translations:Dictionaries/37/nlCreated page with "Inbegrepen bij het Europees Woordenboekportaal zijn tientallen woordenboeken in verscheidene talen, onder andere Frans, Duits, Engels, Nederlands, maar ook minder voor de hand liggende talen, zoals het Baskisch, Catalaans, IJslands, Iers, Grieks, Macedonisch, Russisch en Lets." current
  • 09:5209:52, 26 March 2024 diff hist +183 Dictionaries/nlCreated page with "Het doel van de eWND is om zoveel mogelijk dialectwoordenboeken digitaal beschikbaar en doorzoekbaar te maken, zodat taalkundigen en taalliefhebbers alle belangrijke Nederlandse dialectwoordenboeken op één centraal punt kunnen raadplegen."
  • 09:5209:52, 26 March 2024 diff hist +496 N Translations:Dictionaries/36/nlCreated page with "Het Europees Woordenboekportaal helpt om de weg te vinden naar goede en betrouwbare online woordenboeken voor de Europese talen, ongeacht of u een wetenschapper, vertaler, taaldocent of gewoon een enthousiaste taalgebruiker bent. Alle woordenboeken op hun lijst zijn zorgvuldig uitgezocht door curators uit het European Network of e-Lexicography die deskundige lexicografen zijn en die daarbij duidelijke criteria hanteren om te beslissen welke woordenboeken wel of niet op d..."
  • 09:5109:51, 26 March 2024 diff hist +31 N Translations:Dictionaries/35/nlCreated page with "==Europees Woordenboekportaal==" current
  • 09:4909:49, 26 March 2024 diff hist +440 N Translations:Dictionaries/34/nlCreated page with "===Linguee=== *[https://www.linguee.nl/ Linguee] biedt een online woordenboek voor een aantal taalparen. Linguee gebruikt gespecialiseerde webcrawlers om het Internet te doorzoeken voor geschikte meertalige teksten en om deze op te delen in overeenkomstige zinnen. De achterhaalde gepaarde zinnen ondergaan automatische kwaliteitsevaluatie door een door mensen getraind machine learning-algoritme die de kwaliteit van de vertaling inschat."
  • 09:4409:44, 26 March 2024 diff hist −134 Dictionaries/nlCreated page with "=== Van Dale woordenboeken === Van Dale is a commerciële uitgever van woordenboeken."
  • 09:4309:43, 26 March 2024 diff hist +60 N Translations:Dictionaries/33/nlCreated page with "* [https://vertaalwoordenschat.ivdnt.org/vws/ Online zoeken]" current
  • 09:4209:42, 26 March 2024 diff hist +670 N Translations:Dictionaries/32/nlCreated page with "De Vertaalwoordenschat is een gratis applicatie voor tweetalige woordenboeken met Nederlands als bron- of doeltaal. De applicatie wordt steeds uitgebreid met andere talen. Rond de eeuwwisseling zijn er verschillende tweetalige vertaalwoordenboeken ontwikkeld voor talen die voor Nederlandstaligen wel relevant zijn, maar op de commerciële markt niet spontaan aan bod kwamen. Het initiatief hiervoor kwam van de Commissie Lexicografische Vertaalvoorzieningen (CLVV) van de Ta..."
  • 09:4209:42, 26 March 2024 diff hist −307 Dictionaries/nlCreated page with "==Dialectwoordenboeken== ===Database van de Zuidelijk-Nederlandse Dialecten==="
  • 09:4009:40, 26 March 2024 diff hist +50 N Translations:Dictionaries/31/nlCreated page with "==Vertaalwoordenboeken== ===Vertaalwoordenschat===" current
  • 09:4009:40, 26 March 2024 diff hist +161 N Translations:Dictionaries/30/nlCreated page with "===Pinkhof Geneeskundig Woordenboek=== Het Pinkhof Geneeskundig Woordenboek is gratis online beschikbaar. *[https://pinkhof.ivdnt.org Pinkhof woordenboek online]"
  • 09:3809:38, 26 March 2024 diff hist +34 N Translations:Dictionaries/29/nlCreated page with "==Domeinspecifieke woordenboeken==" current
  • 09:3709:37, 26 March 2024 diff hist +105 N Translations:Dictionaries/28/nlCreated page with "* [http://ewnd.ivdnt.org/ Project pagina eWND] * [http://ewnd.ivdnt.org/boeken/zoeken Online zoeken eWND]" current
  • 09:3609:36, 26 March 2024 diff hist +240 N Translations:Dictionaries/27/nlCreated page with "Het doel van de eWND is om zoveel mogelijk dialectwoordenboeken digitaal beschikbaar en doorzoekbaar te maken, zodat taalkundigen en taalliefhebbers alle belangrijke Nederlandse dialectwoordenboeken op één centraal punt kunnen raadplegen."
  • 09:3609:36, 26 March 2024 diff hist +161 N Translations:Dictionaries/26/nlCreated page with "De elektronische Woordenbank van de Nederlandse Dialecten (eWND) is een digitaal doorzoekbare verzameling van oude en modernere Nederlandse dialectwoordenboeken." current
  • 09:3509:35, 26 March 2024 diff hist +60 N Translations:Dictionaries/25/nlCreated page with "===elektronische Woordenbank van de Nederlandse Dialecten===" current
  • 09:3509:35, 26 March 2024 diff hist −313 Dictionaries/nlCreated page with "Neologismen in het Algemeen Nederlands Woordenboek (ANW) Een gedeelte van deze neologismen wordt ook opgenomen in het Algemeen Nederlands Woordenboek (ANW), een woordenboek van modern Nederlands. Niet alle nieuwe woorden worden in het ANW opgenomen, omdat veel neologismen maar kort gebruikt worden en weer verdwijnen, bijvoorbeeld veel nieuwe woorden op het gebied van mode, zoals jegging ‘jeanslegging’."
  • 09:3409:34, 26 March 2024 diff hist +39 N Translations:Dictionaries/24/nlCreated page with "*[https://dsdd.ivdnt.org Online zoeken]" current
  • 09:3409:34, 26 March 2024 diff hist +482 N Translations:Dictionaries/23/nlCreated page with "Pepel, kapel, flikkenteer, schoenlapper en uiltje: een greep uit zo’n 200 woorden voor vlinder die voorkomen in de Database van de Zuidelijk-Nederlandse Dialecten (Database of the Southern Dutch Dialects – DSDD). De database bevat 460.000 woorden uit de Zuidelijk-Nederlandse dialecten en is een samenvoeging van de gegevens uit het Woordenboek van de Vlaamse Dialecten (WVD), het Woordenboek van de Brabantse Dialecten (WBD) en het Woordenboek van de Limburgse Dialecten..." current
  • 09:3409:34, 26 March 2024 diff hist +136 N Translations:Dictionaries/22/nlCreated page with "De Database van de Zuidelijk-Nederlandse Dialecten (DSDD) is een online dialectportaal van de Vlaamse, Brabantse en Limburgse dialecten." current
  • 09:3309:33, 26 March 2024 diff hist +78 N Translations:Dictionaries/21/nlCreated page with "==Dialectwoordenboeken== ===Database van de Zuidelijk-Nederlandse Dialecten===" current
  • 09:3209:32, 26 March 2024 diff hist +194 N Translations:Dictionaries/20/nlCreated page with "* [https://combinatiewoordenboek.nl/ Combinatiewoordenboek] Nederlandse substantieven met hun vaste verba * [https://woordcombinaties.ivdnt.org/ Woordcombinaties] Werkwoorden met hun combinaties"
  • 09:3209:32, 26 March 2024 diff hist −460 Dictionaries/nlCreated page with "=== Nieuwe woorden - Neologismen==="
  • 09:3109:31, 26 March 2024 diff hist +31 N Translations:Dictionaries/19/nlCreated page with "=== Combinatiewoordenboeken ===" current
  • 09:3009:30, 26 March 2024 diff hist +208 N Translations:Dictionaries/18/nlCreated page with "*[http://anw.ivdnt.org/search?type=feature&tijd=neologisme&order=tijd Zoek naar neologismen in het ANW] *[https://neologismen.ivdnt.org/search Woordenboek van Nieuwe Woorden]: WNW (Woordenboek Nieuwe Woorden)" current
  • 09:2909:29, 26 March 2024 diff hist +1 Translations:Dictionaries/17/nlNo edit summary current
  • 09:2909:29, 26 March 2024 diff hist +411 N Translations:Dictionaries/17/nlCreated page with "Neologismen in het Algemeen Nederlands Woordenboek (ANW) Een gedeelte van deze neologismen wordt ook opgenomen in het Algemeen Nederlands Woordenboek (ANW), een woordenboek van modern Nederlands. Niet alle nieuwe woorden worden in het ANW opgenomen, omdat veel neologismen maar kort gebruikt worden en weer verdwijnen, bijvoorbeeld veel nieuwe woorden op het gebied van mode, zoals jegging ‘jeanslegging’."
  • 09:2809:28, 26 March 2024 diff hist +632 N Translations:Dictionaries/16/nlCreated page with "Ieder jaar komen er duizenden nieuwe woorden, neologismen, bij. Onder neologismen worden niet alleen nieuwgevormde woorden verstaan, maar ook al bestaande woorden met een nieuwe betekenis en nieuwe leenwoorden. Veel neologismen zijn minder nieuw dan ze lijken, omdat meestal twee al bestaande woorden worden samengevoegd in een nieuwe samenstelling, bijvoorbeeld bomdatabank, fietssnelweg en hangoudere. Ook zijn er veel nieuwe samenstellingen waarin bestaande woorden verkor..." current
  • 09:2609:26, 26 March 2024 diff hist +35 N Translations:Dictionaries/15/nlCreated page with "=== Nieuwe woorden - Neologismen===" current
  • 09:2309:23, 26 March 2024 diff hist +42 N Translations:Dictionaries/14/nlCreated page with "*[https://www.vandale.nl/ Van Dale online]" current
  • 09:2309:23, 26 March 2024 diff hist +85 N Translations:Dictionaries/13/nlCreated page with "=== Van Dale woordenboeken === Van Dale is a commerciële uitgever van woordenboeken."
  • 09:2309:23, 26 March 2024 diff hist +58 N Translations:Dictionaries/12/nlCreated page with "*[http://anw.ivdnt.org/ ANW online woordenboek doorzoeken]"
  • 09:2209:22, 26 March 2024 diff hist −46 Dictionaries/nlCreated page with "Etymologische woordenboeken beschrijven specifiek de herkomst van woorden. Het meest recente etymologische woordenboek is het Etymologisch Woordenboek van het Nederlands (EWN) dat onder meer op het voormalige Instituut voor Nederlandse Lexicologie (INL) is gemaakt. Ook onze woordenboeken over het Oudnederlands en het Middelnederlands vermelden vaak etymologische gegevens."
  • 09:2209:22, 26 March 2024 diff hist +530 N Translations:Dictionaries/11/nlCreated page with "Het Algemeen Nederlands Woordenboek (ANW) is een online woordenboek dat het moderne Nederlands vanaf 1970 tot nu beschrijft. Het ANW beschrijft het algemene Nederlands in Nederland en de Caribische rijksdelen, Vlaanderen en Suriname, en richt zich vooral op geschreven taal. In 2009 verschenen de eerste woorden van het ANW op internet en het woordenboek wordt iedere dag geüpdatet. Het ANW is een interactief woordenboek. Aanvullingen en correcties worden regelmatig verwer..." current
  • 09:2209:22, 26 March 2024 diff hist −61 Dictionaries/nlCreated page with "==Moderne Woordenboeken== === Algemeen Nederlands Woordenboek ==="
  • 09:2009:20, 26 March 2024 diff hist +65 N Translations:Dictionaries/10/nlCreated page with "==Moderne Woordenboeken== === Algemeen Nederlands Woordenboek ===" current
  • 09:1709:17, 26 March 2024 diff hist −188 Dictionaries/nlCreated page with "Op *[http://www.etymologiebank.nl/ Etymologiebank] is informatie uit een grote hoeveelheid Nederlandse etymologische bronnen verzameld en toegankelijk gemaakt."
  • 09:1109:11, 26 March 2024 diff hist +159 N Translations:Dictionaries/9/nlCreated page with "Op *[http://www.etymologiebank.nl/ Etymologiebank] is informatie uit een grote hoeveelheid Nederlandse etymologische bronnen verzameld en toegankelijk gemaakt."
  • 09:1009:10, 26 March 2024 diff hist +374 N Translations:Dictionaries/8/nlCreated page with "Etymologische woordenboeken beschrijven specifiek de herkomst van woorden. Het meest recente etymologische woordenboek is het Etymologisch Woordenboek van het Nederlands (EWN) dat onder meer op het voormalige Instituut voor Nederlandse Lexicologie (INL) is gemaakt. Ook onze woordenboeken over het Oudnederlands en het Middelnederlands vermelden vaak etymologische gegevens."
  • 09:0809:08, 26 March 2024 diff hist +263 N Translations:Dictionaries/7/nlCreated page with "Woorden hebben een geschiedenis. Ze ontstaan, ontwikkelen zich en passen zich aan veranderende omstandigheden aan. Soms verdwijnen ze ook weer, na korte of lange tijd. De wetenschap die de oorsprong en geschiedenis van woorden onderzoekt wordt etymologie genoemd." current
  • 09:0809:08, 26 March 2024 diff hist −58 Dictionaries/nlCreated page with "*[https://gtb.ivdnt.org/search/ Online woordenboeken doorzoeken]"
  • 09:0809:08, 26 March 2024 diff hist +32 N Translations:Dictionaries/6/nlCreated page with "== Etymologische woordenboeken==" current
  • 09:0709:07, 26 March 2024 diff hist +64 N Translations:Dictionaries/5/nlCreated page with "*[https://gtb.ivdnt.org/search/ Online woordenboeken doorzoeken]" current
  • 09:0709:07, 26 March 2024 diff hist −42 Dictionaries/nlCreated page with "Samen beschrijven ze de Nederlandse woordenschat van circa 500 tot 1976, en de Friese woordenschat van 1800 tot 1975. Voor alle taalgebruikers – van taalwetenschappers tot kruiswoordpuzzelaars – is deze woordenboekapplicatie een bron van kennis én plezier."
  • 09:0709:07, 26 March 2024 diff hist +261 N Translations:Dictionaries/4/nlCreated page with "Samen beschrijven ze de Nederlandse woordenschat van circa 500 tot 1976, en de Friese woordenschat van 1800 tot 1975. Voor alle taalgebruikers – van taalwetenschappers tot kruiswoordpuzzelaars – is deze woordenboekapplicatie een bron van kennis én plezier." current

21 March 2024

  • 15:2915:29, 21 March 2024 diff hist +9,854 N Dictionaries/nlCreated page with "* Oudnederlands Woordenboek (ONW) 500-1200 * Vroegmiddelnederlands Woordenboek (VMNW) 1200-1300 * Middelnederlandsch Woordenboek (MNW) 1250-1550 * Woordenboek der Nederlandsche Taal (WNT) 1500-1976 * Woordenboek der Friese Taal (WFT) 1800-1975: The "Wurdboek fan de Fryske taal" beschrijft het (vooral geschreven) Nieuwfries uit de Nederlandse provincie Friesland van 1800 tot en met 1975. Het bevat ruim 120.000 trefwoorden. De woordenboekartikelen geven info..."
  • 15:1615:16, 21 March 2024 diff hist +765 N Translations:Dictionaries/3/nlCreated page with "* Oudnederlands Woordenboek (ONW) 500-1200 * Vroegmiddelnederlands Woordenboek (VMNW) 1200-1300 * Middelnederlandsch Woordenboek (MNW) 1250-1550 * Woordenboek der Nederlandsche Taal (WNT) 1500-1976 * Woordenboek der Friese Taal (WFT) 1800-1975: The "Wurdboek fan de Fryske taal" beschrijft het (vooral geschreven) Nieuwfries uit de Nederlandse provincie Friesland van 1800 tot en met 1975. Het bevat ruim 120.000 trefwoorden. De woordenboekartikelen geven info..."
  • 15:1415:14, 21 March 2024 diff hist +129 N Translations:Dictionaries/2/nlCreated page with "Het Instituut voor de Nederlandse taal stelt de volgende historische woordenboeken beschikbaar in één online zoeken applicatie:"
  • 15:1215:12, 21 March 2024 diff hist +31 N Translations:Dictionaries/1/nlCreated page with "== Historische Woordenboeken ==" current
  • 15:1215:12, 21 March 2024 diff hist +13 N Translations:Dictionaries/Page display title/nlCreated page with "Woordenboeken" current
  • 15:1215:12, 21 March 2024 diff hist +447 DictionariesMarked this version for translation
  • 15:1215:12, 21 March 2024 diff hist +24 DictionariesNo edit summary
  • 15:1115:11, 21 March 2024 diff hist 0 LexicaNo edit summary
  • 15:1115:11, 21 March 2024 diff hist −83 Lexica/nlCreated page with "*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_eacl046.pdf Jijkoun, V., Hofmann, K. (2009). Generating a Non-English Subjectivity Lexicon: Relations That Matter] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_subjectivity-lexicon-report.pdf Documentatie] *[http://hdl.handle.net/10032/tm-a2-g9 Download pagina]"
  • 15:1115:11, 21 March 2024 diff hist +14 LexicaNo edit summary
  • 15:1015:10, 21 March 2024 diff hist +62 N Translations:Lexica/55/nlCreated page with "* [https://hdl.handle.net/21.11129/0000-000B-D37C-C Webpagina]" current
  • 15:1015:10, 21 March 2024 diff hist +443 N Translations:Lexica/54/nlCreated page with "=== QTLeap specialized lexicons === Deze gids bestaat uit meertalige lexicon entries die worden gebruikt voor de vertaling van specifieke IT-domeinuitdrukkingen voor het Baskisch, Bulgaars, Tsjechisch, Nederlands, Engels, Portugees en Spaans. De uitdrukkingen zijn aan de ene kant verzameld uit de gratis beschikbare software lokaliseringsbestanden, zoals VLC, Libre Office en KDE en aan de andere kant uit IT-gerelateerde Wikipedia-artikelen."
  • 15:0815:08, 21 March 2024 diff hist −222 Lexica/nlCreated page with "=== Polderland Dutch Lexicon of Abbreviations and Acronyms === Het Polderland Dutch Lexicon of Abbreviations and Acronym bestaat uit 2.180 Nederlandse afkortingen en acroniemen. Het houdt zich aan de Nederlandse officiële spelling (2005/6). Het lexicon bevat een ID, word form, lemma en een deel van spraak."
  • 15:0115:01, 21 March 2024 diff hist +50 N Translations:Lexica/53/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-b6 Webpagina]" current
  • 15:0115:01, 21 March 2024 diff hist +254 N Translations:Lexica/52/nlCreated page with "=== OMBI Dutch-Indonesian === OMBI Nederlands-Indonesisch is een bilinguaal lexicaal bestand in xml-LMF-formaat. Het bestand is geschikt voor taaltechnologische toepassingen zoals automatisch vertalen, e-learning, multilingual information retrieval, enz."
  • 15:0115:01, 21 March 2024 diff hist +186 N Translations:Lexica/51/nlCreated page with "* Versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/ombi-dd_documentatie_nl.pdf Documentatie] * [http://hdl.handle.net/10032/tm-a2-b4 Download pagina]"
  • 15:0015:00, 21 March 2024 diff hist +244 N Translations:Lexica/50/nlCreated page with "=== OMBI Dutch-Danish === OMBI Nederlands-Deens is een bilinguaal lexicaal bestand in xml-LMF-formaat. Het bestand is geschikt voor taaltechnologische toepassingen zoals automatisch vertalen, e-learning, multilingual information retrieval, enz."
  • 15:0015:00, 21 March 2024 diff hist +186 N Translations:Lexica/49/nlCreated page with "* Versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/ombi-da_documentatie_en.pdf Documentatie] * [http://hdl.handle.net/10032/tm-a2-b5 Download pagina]"
  • 15:0015:00, 21 March 2024 diff hist +129 N Translations:Lexica/48/nlCreated page with "=== OMBI Dutch-Arabic === OMBI Nederlands-Arabisch is een tweetalig lexicon met Nederlands als brontaal en Arabisch als doeltaal."
  • 14:5814:58, 21 March 2024 diff hist +186 N Translations:Lexica/47/nlCreated page with "* Versie 1.0 (2010) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/ombi-da_documentatie_en.pdf Documentatie] * [http://hdl.handle.net/10032/tm-a2-b3 Download pagina]"
  • 14:5814:58, 21 March 2024 diff hist +274 N Translations:Lexica/46/nlCreated page with "=== OMBI Arabic-Dutch === OMBI-Arabisch-Nederlands is een bilinguaal lexicaal bestand in xml-LMF-formaat. Het bestand bevat ca. 37.000 entry's en is geschikt voor taaltechnologische toepassingen zoals automatisch vertalen, e-learning, multilingual information retrieval etc."
  • 14:5714:57, 21 March 2024 diff hist +23 N Translations:Lexica/45/nlCreated page with "== Meertalige Lexica ==" current
  • 14:5714:57, 21 March 2024 diff hist +50 N Translations:Lexica/44/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-m4 Webpagina]" current
  • 14:5714:57, 21 March 2024 diff hist +29 Translations:Lexica/41/nlNo edit summary current
  • 14:5614:56, 21 March 2024 diff hist +246 N Translations:Lexica/43/nlCreated page with "=== Parole Lexicon === Het PAROLE-lexicon is een computationeel lexicon met Nederlands taalmateriaal van ongeveer 1970-1998. Het bevat ruim 20.000 entry’s, die voorzien zijn van woordsoort, getal, naamval en syntactische complementatiepatronen."
  • 14:5614:56, 21 March 2024 diff hist −386 Lexica/nlCreated page with "*[http://catalog.elra.info/en-us/repository/browse/ELRA-L0077/ Order pagina (kosten zijn van toepassing)]"
  • 14:5614:56, 21 March 2024 diff hist +256 N Translations:Lexica/42/nlCreated page with "* [http://hdl.handle.net/11356/1318 Webpagina] * Daelemans, Walter; et al., 2020, The LiLaH Emotion Lexicon of Croatian, Dutch and Slovene, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, <nowiki>http://hdl.handle.net/11356/1318</nowiki>." current
  • 14:5514:55, 21 March 2024 diff hist +516 N Translations:Lexica/41/nlCreated page with "Dit product bevat een uitbreiding van het NRC-emotielexicon. Het bevat een lijst met woorden in het Grieks, Koerdisch, Turks, Spaans, Farsi en Chinees (traditioneel en vereenvoudigd) en hun associaties met acht basisemoties (boosheid, angst, verwachting, vertrouwen, verrassing, verdriet, vreugde en afkeer) en twee sentimenten (negatief en positief). De annotaties zijn automatisch gegenereerd en handmatig gecontroleerd door moedertaalsprekers. Aanvullende talen (waaronder..."
  • 14:5414:54, 21 March 2024 diff hist −78 Lexica/nlCreated page with "=== Polderland Dutch General Lexicon === Het Polderland Dutch General Lexicon bevat 400.463 Nederlandse woorden, bestaand uit 236.369 zelfstandige naamwoorden, 90.882 adjectieven, 69.744 werkwoorden, 2.120 bijwoorden en 1.348 items uit andere categorieën (voornaamwoorden, bepalingen, samenvoegingen telwoorden, etc.). Het houdt zich aan de officiële Nederlandse spelling (2005/6). Het lexicon bevat een ID, word form, lemma en een deel van spraak."
  • 14:5414:54, 21 March 2024 diff hist +212 N Translations:Lexica/40/nlCreated page with "*[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://www.researchgate.net/publication/251414440_Classification_of_Noun-Noun_Compound_Semantics_in_Dutch_and_Afrikaans Paper]" current
  • 14:5314:53, 21 March 2024 diff hist +518 N Translations:Lexica/39/nlCreated page with "=== AuCoPro-Semantics === De AuCoPro-Semantics-dataset dient de automatische semantische analyse van compounds. Het bevat semantisch geannoteerde zelfstandig naamwoord compounds van het Nederlands en Afrikaans, gescheiden in twee annotatieronden per taal. De semantische annotatie is uitgevoerd met annotatierichtlijnen gebaseerd op die van Ó. Séaghdha (2008). Een ander deel van de dataset bevat andere nominale compounds in het Nederlands, die zijn geannoteerd met gebrui..."
  • 14:4314:43, 21 March 2024 diff hist −90 Lexica/nlCreated page with "=== DuELME === DuELME is een lexicon met ruim 5000 Nederlandstalige meerwoordexpressies."
  • 14:4214:42, 21 March 2024 diff hist −5 Translations:Lexica/36/nlNo edit summary
  • 14:4214:42, 21 March 2024 diff hist +100 N Translations:Lexica/38/nlCreated page with "*[http://catalog.elra.info/en-us/repository/browse/ELRA-L0076/ Order pagina (kosten van toepassing)]"
  • 14:4214:42, 21 March 2024 diff hist +308 N Translations:Lexica/37/nlCreated page with "=== Polderland Dutch Lexicon of Abbreviations and Acronyms === Het Polderland Dutch Lexicon of Abbreviations and Acronym bestaat uit 2.180 Nederlandse afkortingen en acroniemen. Het houdt zich aan de Nederlandse officiële spelling (2005/6). Het lexicon bevat een ID, word form, lemma en een deel van spraak."
  • 14:3614:36, 21 March 2024 diff hist −131 Lexica/nlCreated page with "*[https://cental.uclouvain.be/cefrlex/nt2lex Bron website]"
  • 14:3514:35, 21 March 2024 diff hist +105 N Translations:Lexica/36/nlCreated page with "*[http://catalog.elra.info/en-us/repository/browse/ELRA-L0077/ Order pagina (kosten zijn van toepassing)]"
  • 14:3414:34, 21 March 2024 diff hist +450 N Translations:Lexica/35/nlCreated page with "=== Polderland Dutch General Lexicon === Het Polderland Dutch General Lexicon bevat 400.463 Nederlandse woorden, bestaand uit 236.369 zelfstandige naamwoorden, 90.882 adjectieven, 69.744 werkwoorden, 2.120 bijwoorden en 1.348 items uit andere categorieën (voornaamwoorden, bepalingen, samenvoegingen telwoorden, etc.). Het houdt zich aan de officiële Nederlandse spelling (2005/6). Het lexicon bevat een ID, word form, lemma en een deel van spraak."
  • 14:2914:29, 21 March 2024 diff hist +103 N Translations:Lexica/34/nlCreated page with "*[http://hdl.handle.net/10032/tm-a2-a5 Download pagina] *[http://www.impact-project.eu/ Project pagina]"
  • 14:2914:29, 21 March 2024 diff hist +572 N Translations:Lexica/33/nlCreated page with "=== INT IMPACT NE-lexicon === Het INT IMPACT NE-lexicon is een uitgebreide set van verrijkte historische Nederlandse locaties, persoonsnamen en organisaties. Alle locaties en organisaties zijn verbonden aan een handmatig geverifieerde moderne lemma en, waar van toepassingen, aan mogelijke alternatieve namen. Persoonsnamen zijn handmatig geannoteerd met structurele informatie (bijv. 'roepnaam', 'achternaam', etc.), verbonden aan mogelijke varianten en mogelijke matches i..."
  • 14:2514:25, 21 March 2024 diff hist −159 Lexica/nlCreated page with "=== e-Lex === E-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan 77.000 meerwoordsuitdrukkingen en 26.000 meerwoordslemma's."
  • 14:2214:22, 21 March 2024 diff hist +55 N Translations:Lexica/32/nlCreated page with "*[http://hdl.handle.net/10032/tm-a2-j9 Download pagina]"
  • 14:2214:22, 21 March 2024 diff hist +265 N Translations:Lexica/31/nlCreated page with "Expressies met hetzelfde syntactische patroon zijn gegroepeerd in zogenoemde equivalence classes, wat het mogelijk maakt om het lexicon met minimale handmatige inspanning te integreren in een NLP-systeem. Het lexicon is ontwikkeld in het kader van het IRME-project."
  • 14:2214:22, 21 March 2024 diff hist +88 N Translations:Lexica/30/nlCreated page with "=== DuELME === DuELME is een lexicon met ruim 5000 Nederlandstalige meerwoordexpressies."
  • 14:2214:22, 21 March 2024 diff hist −96 Lexica/nlCreated page with "GiGaNT Molex versie 1.0 is uitgegeven en is beschikbaar om te downloaden."
  • 14:2114:21, 21 March 2024 diff hist +41 N Translations:Lexica/29/nlCreated page with "*[http://isla.ruhosting.nl/ ISLA project]" current
  • 14:2114:21, 21 March 2024 diff hist +171 N Translations:Lexica/28/nlCreated page with "=== ISLA: Idiomatic expressions for Second Language Acquisition === Het ISLA-project heeft een verzameling van ongeveer 400 idiomatische uitdrukkingen en hun betekenissen." current
  • 14:2014:20, 21 March 2024 diff hist +55 N Translations:Lexica/27/nlCreated page with "*[http://hdl.handle.net/10032/tm-a2-h2 Download pagina]"
  • 14:2014:20, 21 March 2024 diff hist +450 N Translations:Lexica/26/nlCreated page with "=== e-Lex === E-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan 77.000 meerwoordsuitdrukkingen en 26.000 meerwoordslemma's." current
  • 14:1914:19, 21 March 2024 diff hist +204 N Translations:Lexica/25/nlCreated page with "* Versie 1.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/rbbn_handleiding1.0_nl.pdf Handleiding (in het Nederlands)] *[http://hdl.handle.net/10032/tm-a2-h4 Download pagina]"
  • 14:1914:19, 21 March 2024 diff hist +183 N Translations:Lexica/24/nlCreated page with "=== Referentiebestand Belgisch-Nederlands (RBBN) === Het Referentiebestand Belgisch-Nederlands bevat ca. 4000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in België."
  • 14:1914:19, 21 March 2024 diff hist +202 N Translations:Lexica/23/nlCreated page with "* Versie 2.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/rbn_documentatie_nl.pdf Documentatie (in het Nederlands)] *[http://hdl.handle.net/10032/tm-a2-n2 Download pagina]"
  • 14:1814:18, 21 March 2024 diff hist +162 N Translations:Lexica/22/nlCreated page with "=== Referentienbestand Nederlands (RBN) === Het Referentiebestand Nederlands is een lexicon met ongeveer 50.000 trefwoorden en 90.000 vaste en vrije verbindingen."
  • 14:1814:18, 21 March 2024 diff hist −971 Lexica/nlCreated page with "=== BasiLex-lexicon === Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd."
  • 14:1814:18, 21 March 2024 diff hist +128 N Translations:Lexica/21/nlCreated page with "*[https://ivdnt.org/corpora-lexica/diamant/?highlight=diamant Informatie] *[https://diamant.ivdnt.org/diamant-ui/ Online zoeken]" current
  • 14:1814:18, 21 March 2024 diff hist +543 N Translations:Lexica/20/nlCreated page with "=== Diachroon seMantisch lexicon van de Nederlandse Taal - DiaMaNT === Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen wo..." current
  • 14:1614:16, 21 March 2024 diff hist +15 Translations:Lexica/4/nlNo edit summary current
  • 14:1514:15, 21 March 2024 diff hist +364 N Translations:Lexica/19/nlCreated page with "*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_eacl046.pdf Jijkoun, V., Hofmann, K. (2009). Generating a Non-English Subjectivity Lexicon: Relations That Matter] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_subjectivity-lexicon-report.pdf Documentatie] *[http://hdl.handle.net/10032/tm-a2-g9 Download pagina]"
  • 14:1414:14, 21 March 2024 diff hist +252 N Translations:Lexica/18/nlCreated page with "=== DuOMAn Subjectivity Lexicon === Het DuOMAn Subjectivity Lexicon bevat ongeveer 9000 werkwoorden, bijwoorden, substantieven en adjectieven waarvan aangegeven werd of ze een (zeer) negatieve, een neutrale of een (zeer) positieve gevoelswaarde hebben."
  • 14:1114:11, 21 March 2024 diff hist +145 N Translations:Lexica/17/nlCreated page with "* Versie 1.0 (2015) * [https://www.narcis.nl/research/RecordID/OND1347377 Projectpagina] * [http://hdl.handle.net/10032/tm-a2-f2 Download pagina]"
  • 14:1014:10, 21 March 2024 diff hist +247 N Translations:Lexica/16/nlCreated page with "=== BasiScript-lexicon === Het BasiScript-lexicon bevat alle lemma's van het BasiScript Corpus met aanvullende informatie. BasiScript is een corpus met 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool." current
  • 14:0814:08, 21 March 2024 diff hist +396 N Translations:Lexica/15/nlCreated page with "* Versie 1.0 (2015) * [https://www.clips.uantwerpen.be/00.old.drupal/clinjournal/sites/default/files/13-Tellings-etal-CLIN2014.pdf Tellings, A., Hulsbosch, M., Vermeer, A. & van den Bosch, A. (2015). BasiLex: an 11.5-million words corpus of Dutch texts written for children. Computational Linguistics in the Netherlands Journal 4, 191-208] * [http://hdl.handle.net/10032/tm-a2-k7 Download pagina]"
  • 14:0814:08, 21 March 2024 diff hist +201 N Translations:Lexica/14/nlCreated page with "=== BasiLex-lexicon === Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd." current
  • 14:0714:07, 21 March 2024 diff hist +1,001 N Translations:Lexica/13/nlCreated page with "De Nederlandse CELEX Data en subsets daarvan zijn beschikbaar bij ELRA (kosten zijn van toepassing) * [http://catalog.elra.info/product_info.php?products_id=439 Download pagina CELEX Dutch lexical database - Complete set] * [http://catalog.elra.info/product_info.php?products_id=443 Download pagina CELEX Dutch lexical database - Derivational Morphology Subset] *[http://catalog.elra.info/product_info.php?products_id=445 Download pagina CELEX Dutch lexical database - Frequ..." current
  • 14:0514:05, 21 March 2024 diff hist +50 N Translations:Lexica/12/nlCreated page with "* [http://portal.clarin.inl.nl/webcelex/ WebCelex]" current
  • 14:0514:05, 21 March 2024 diff hist +275 N Translations:Lexica/11/nlCreated page with "=== CELEX and WebCelex === Interface waarmee de CELEX-lexicale databases van het Duits, Engels, Nederlands kunnen worden geraadpleegd. Voor iedere taal zijn de lemma's aangevuld met orthografische, fonologische, morfologische en syntactische informatie en frequentiegegevens." current
  • 14:0114:01, 21 March 2024 diff hist −56 Lexica/nlCreated page with "De standaardmodules van GiGaNT Hilex zijn beschikbaar gemaakt doormiddel van een lexicon-service. Als u gebruik wilt maken van deze service, neem dan contact op met [mailto://katrien.depuydt@ivdnt.org Katrien Depuydt]."
  • 14:0114:01, 21 March 2024 diff hist +58 N Translations:Lexica/10/nlCreated page with "*[https://cental.uclouvain.be/cefrlex/nt2lex Bron website]"
  • 14:0014:00, 21 March 2024 diff hist +346 N Translations:Lexica/9/nlCreated page with "=== NT2Lex === NT2Lex is een lexicale database voor het Nederlands als een buitenlandse taal (NT2) en bevat frequentieverdelingen van in teksten waargenomen woorden die zijn becijferd op basis van de zes-niveaus tellende schaal van het Common European Framework of Reference for Languages. Beschikbaar om online te doorzoeken en om te downloaden."
  • 13:5613:56, 21 March 2024 diff hist −110 Lexica/nlCreated page with "*[http://diamant.ivdnt.org/diamant-ui/ Weblink] *[https://ivdnt.org/corpora-lexica/diamant/#diamant Projectbeschrijving]"
  • 13:5413:54, 21 March 2024 diff hist +132 N Translations:Lexica/8/nlCreated page with "*[https://ivdnt.org/corpora-lexica/gigant/ Projectbeschrijving] *[http://hdl.handle.net/10032/tm-a2-u7 Download pagina GiGaNT-Molex]"
  • 13:5413:54, 21 March 2024 diff hist +73 N Translations:Lexica/7/nlCreated page with "GiGaNT Molex versie 1.0 is uitgegeven en is beschikbaar om te downloaden."
  • 13:5413:54, 21 March 2024 diff hist +15,839 N Lexica/nlCreated page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora."
  • 13:5313:53, 21 March 2024 diff hist +219 N Translations:Lexica/6/nlCreated page with "De standaardmodules van GiGaNT Hilex zijn beschikbaar gemaakt doormiddel van een lexicon-service. Als u gebruik wilt maken van deze service, neem dan contact op met [mailto://katrien.depuydt@ivdnt.org Katrien Depuydt]." current
  • 13:5113:51, 21 March 2024 diff hist +236 N Translations:Lexica/5/nlCreated page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora." current
  • 13:5113:51, 21 March 2024 diff hist +370 N Translations:Lexica/4/nlCreated page with "Op dit moment ontwikkelt het Instituut voor de Nederlandse Taal (INT) een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon, met de naam GiGaNT, vormt straks een verzameling van woorden en woordgroepen, waaronder named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten."
  • 13:5013:50, 21 March 2024 diff hist +120 N Translations:Lexica/3/nlCreated page with "*[http://diamant.ivdnt.org/diamant-ui/ Weblink] *[https://ivdnt.org/corpora-lexica/diamant/#diamant Projectbeschrijving]" current
  • 13:5013:50, 21 March 2024 diff hist +704 N Translations:Lexica/2/nlCreated page with "=== DiaMaNT === Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen woordvormen en betekeniseenheden (concepten) en plaatst z..." current
  • 13:4813:48, 21 March 2024 diff hist +22 N Translations:Lexica/1/nlCreated page with "== Eentalige Lexica ==" current
  • 13:4713:47, 21 March 2024 diff hist +6 N Translations:Lexica/Page display title/nlCreated page with "Lexica" current
  • 13:4613:46, 21 March 2024 diff hist +651 LexicaMarked this version for translation
  • 13:4613:46, 21 March 2024 diff hist +25 LexicaNo edit summary
  • 13:3713:37, 21 March 2024 diff hist +14 Other corporaNo edit summary
  • 13:3713:37, 21 March 2024 diff hist −108 Other corpora/nlCreated page with "* [http://gigacorpus.nl/ Project website] *"
  • 13:3613:36, 21 March 2024 diff hist −2 Translations:Other corpora/40/nlNo edit summary
  • 13:3613:36, 21 March 2024 diff hist +43 N Translations:Other corpora/40/nlCreated page with "* [http://gigacorpus.nl/ Project website] *"
  • 13:3613:36, 21 March 2024 diff hist +432 N Translations:Other corpora/39/nlCreated page with "== Dutch Gigacorpus == Met 234GB aan gevarieerde platte tekst, maarliefst 40 miljard tokens, is dit in ieder geval het grootste Nederlandse corpus. Maar daarnaast is dit corpus ook vrij beschikbaar en de kwaliteit is relatief hoog voor zijn omvang, zorg is gedragen voor het zo schoon mogelijk krijgen van de data. Ook bevat het corpus 400 miljoen forumposts in 10 miljoen threads met hun timestamp intact voor taalkundig onderzoek."
  • 13:3513:35, 21 March 2024 diff hist −542 Other corpora/nlCreated page with "*[https://data.statmt.org/cc-100/ Corpus website met downloadlinks per taal] *[https://www.aclweb.org/anthology/2020.acl-main.747 Paper webpagina] *[https://aclanthology.org/2020.lrec-1.494/ Paper webpagina]"
  • 13:3513:35, 21 March 2024 diff hist +207 N Translations:Other corpora/38/nlCreated page with "*[https://data.statmt.org/cc-100/ Corpus website met downloadlinks per taal] *[https://www.aclweb.org/anthology/2020.acl-main.747 Paper webpagina] *[https://aclanthology.org/2020.lrec-1.494/ Paper webpagina]"
  • 13:3413:34, 21 March 2024 diff hist +251 N Translations:Other corpora/37/nlCreated page with "==CC-100 Corpus== Dit corpus is een poging om de dataset die wordt gebruikt voor het trainen van XLM-R opnieuw te creëren. Dit corpus bestaat uit eentalige data voor 100+ talen en bevat daarnaast data voor geromaniseerde talen (aangegeven door *_rom)" current
  • 13:2513:25, 21 March 2024 diff hist −41 Other corpora/nlCreated page with "==Named Entity Recognition CoNLL2002== Spaanse en Nederlandse data met named entity labels. De Nederlandse data bestaat uit vier edities van de Belgische krant 'De Morgen' uit 2000 (2 juni, 1 juli, 1 augustus en 1 september). Voor de Nederlandse data heeft de annotator zo goed als mogelijk de MITRE en SAIC-richtlijnen voor named entity recognition (Chinchor et al.,1999) gevolgd. *[https://huggingface.co/datasets/conll2002 CoNLL2002 Dataset]"
  • 13:2513:25, 21 March 2024 diff hist +445 N Translations:Other corpora/36/nlCreated page with "==Named Entity Recognition CoNLL2002== Spaanse en Nederlandse data met named entity labels. De Nederlandse data bestaat uit vier edities van de Belgische krant 'De Morgen' uit 2000 (2 juni, 1 juli, 1 augustus en 1 september). Voor de Nederlandse data heeft de annotator zo goed als mogelijk de MITRE en SAIC-richtlijnen voor named entity recognition (Chinchor et al.,1999) gevolgd. *[https://huggingface.co/datasets/conll2002 CoNLL2002 Dataset]"
  • 13:2113:21, 21 March 2024 diff hist −34 Other corpora/nlCreated page with "*[https://doi.org/10.5281/zenodo.1035175 Webpagina] *[https://doi.org/10.5281/zenodo.1035175 Paper]"
  • 13:2113:21, 21 March 2024 diff hist +99 N Translations:Other corpora/35/nlCreated page with "*[https://doi.org/10.5281/zenodo.1035175 Webpagina] *[https://doi.org/10.5281/zenodo.1035175 Paper]" current
  • 13:2113:21, 21 March 2024 diff hist +525 N Translations:Other corpora/34/nlCreated page with "==Dutch Audio Description Corpus== Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. De data bestaat uit de corpusbestanden (XML-bestanden) van de getranscribeerde audiobeschrijvingen, de multimodale concordantie die is ontwikkeld voor het project en de rauwe data die is geëxtraheerd uit het corpus als onderdeel van het promo..."
  • 13:1713:17, 21 March 2024 diff hist −180 Other corpora/nlCreated page with "==MQA (Multilingual corpus of Questions and Answers)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bestaat uit 234 miljoen paren van vragen en antwoorden in 39 verschillende talen."
  • 13:1513:15, 21 March 2024 diff hist +102 N Translations:Other corpora/33/nlCreated page with "*[https://huggingface.co/datasets/clips/mqa Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]" current
  • 13:1513:15, 21 March 2024 diff hist +206 N Translations:Other corpora/32/nlCreated page with "==MQA (Multilingual corpus of Questions and Answers)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bestaat uit 234 miljoen paren van vragen en antwoorden in 39 verschillende talen." current
  • 13:1413:14, 21 March 2024 diff hist +465 N Translations:Other corpora/31/nlCreated page with "==VaccinChatNL== Een Belgisch-Nederlandse FAQ-dataset op het gebied van COVID-19-vaccinaties in Vlaanderen. Het bestaat uit 12.833 gebruikersvragen, verdeeld over 181 antwoord-labels, waarmee het grote groepen semantisch gelijkwaardige parafrases aanbiedt. VaccinChatNL is de eerste Nederlandse Dutch FAQ dataset van deze grootte. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2022.coling-1.312 Paper]"
  • 13:0913:09, 21 March 2024 diff hist −53 Other corpora/nlCreated page with "Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaand..."
  • 13:0713:07, 21 March 2024 diff hist +337 N Translations:Other corpora/30/nlCreated page with "==MFAQ (Multilingual corpus of Frequently Asked Questions)== Geparseerd van de [https://commoncrawl.org/ Common Crawl]. Het corpus bevat zes miljoen paren van vragen en antwoorden in 21 verschillende talen. *[https://www.uantwerpen.be/en/research-groups/clips/research/datasets/ Webpagina] *[https://aclanthology.org/2021.mrqa-1.1 Paper]" current
  • 13:0613:06, 21 March 2024 diff hist −94 Other corpora/nlCreated page with "==JASMIN-BLISS-Negation== Een corpusvoorbeeld van Nederlandse mens-machinedialogen, geannoteerde met ontkenningssignalen."
  • 13:0413:04, 21 March 2024 diff hist +132 N Translations:Other corpora/29/nlCreated page with "*[https://lt3.ugent.be/resources/multimodal-abea/ Informatiepagina] *[https://lt3.ugent.be/media/uploads/tools/Dataset.zip Download]" current
  • 13:0413:04, 21 March 2024 diff hist +268 N Translations:Other corpora/28/nlCreated page with "== Multimodal ABEA == Multimodale dataset die kan worden gebruikt binnen de context van aspect-based sentiment-en emotieherkenning. Het bestaat uit 4.900 opmerkingen op 175 afbeeldingen op de Adidas Instagram-pagina en is geannoteerd met zowel aspect als emotielabels."
  • 13:0113:01, 21 March 2024 diff hist −94 Other corpora/nlCreated page with "* Versie 1.1 (2020) *[http://hdl.handle.net/10032/tm-a2-r6 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/NAMES-corpus-1.1-manual.pdf Documentatie]"
  • 12:5812:58, 21 March 2024 diff hist +70 N Translations:Other corpora/27/nlCreated page with "*[https://github.com/LanguageMachines/JASMIN-BLISS-Negation Webpagina]" current
  • 12:5812:58, 21 March 2024 diff hist +121 N Translations:Other corpora/26/nlCreated page with "==JASMIN-BLISS-Negation== Een corpusvoorbeeld van Nederlandse mens-machinedialogen, geannoteerde met ontkenningssignalen." current
  • 12:5512:55, 21 March 2024 diff hist −55 Other corpora/nlCreated page with "Een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatsche uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van de uitdrukkingen kenden."
  • 12:5512:55, 21 March 2024 diff hist +65 N Translations:Other corpora/25/nlCreated page with "*[https://zenodo.org/record/4643756#.Yl6GBehBzZQ Download pagina]"
  • 12:5512:55, 21 March 2024 diff hist +609 N Translations:Other corpora/24/nlCreated page with "==Personae Corpus== Het Personae-corpus is verzameld voor experimenten in 'Authorship Attribution and Personality Prediction'. Het bestaat uit 145 Nederlandstalige essays, geschreven door 145 verschillende studenten (BA in taalkunde en literatuur aan de Universiteit van Antwerpen, België). Elke student deed ook een online MBTI-persoonlijkheidstest, wat persoonlijkheidsvoorspellingsexperimenten mogelijk maakt. Het corpus is gecontroleerd op onderwerp, register, genre, le..."
  • 12:5112:51, 21 March 2024 diff hist +377 Other corpora/nlCreated page with "==deLearyous== De deLearyous dataset is een Nederlands (Vlaamse) dataset voor emotieclassificatie volgens het framework van Leary's Rose, beter bekend als het Interpersonal Circumplex. De dataset bestaat uit 11 gesprekken die zijn geannoteerd op zinsniveau met hun positie op Leary's Rose, in functie van de twee kenmerkende dimensies: 'dominantie', en 'affiniteit'."
  • 12:4712:47, 21 March 2024 diff hist +184 N Translations:Other corpora/23/nlCreated page with "* Versie 1.1 (2020) *[http://hdl.handle.net/10032/tm-a2-r6 Download pagina] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/NAMES-corpus-1.1-manual.pdf Documentatie]"
  • 12:4612:46, 21 March 2024 diff hist +775 N Translations:Other corpora/42/nlCreated page with "Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaand..." current
  • 12:4612:46, 21 March 2024 diff hist +17 N Translations:Other corpora/22/nlCreated page with "==NAMES Corpus ==" current
  • 12:4512:45, 21 March 2024 diff hist +172 N Translations:Other corpora/21/nlCreated page with "* Versie 1.0 (2018) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/Methodology.pdf Methodologie] *[http://hdl.handle.net/10032/tm-a2-r7 Download pagina]"
  • 12:4512:45, 21 March 2024 diff hist +342 N Translations:Other corpora/41/nlCreated page with "Een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatsche uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van de uitdrukkingen kenden." current
  • 12:4412:44, 21 March 2024 diff hist +50 N Translations:Other corpora/20/nlCreated page with "==Dutch Idiom Database: Native Speakers (DID-NS)==" current
  • 12:4312:43, 21 March 2024 diff hist +66 N Translations:Other corpora/19/nlCreated page with "* [https://zenodo.org/record/4643731#.YgKUSurMLZR Download pagina]"
  • 12:4312:43, 21 March 2024 diff hist +366 N Translations:Other corpora/18/nlCreated page with "==deLearyous== De deLearyous dataset is een Nederlands (Vlaamse) dataset voor emotieclassificatie volgens het framework van Leary's Rose, beter bekend als het Interpersonal Circumplex. De dataset bestaat uit 11 gesprekken die zijn geannoteerd op zinsniveau met hun positie op Leary's Rose, in functie van de twee kenmerkende dimensies: 'dominantie', en 'affiniteit'." current
  • 12:4112:41, 21 March 2024 diff hist −69 Other corpora/nlCreated page with "== Dutch Audio Description Corpus == Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Dit Dutch AD corpus is gebruikt om een reeks kwantitatieve data betreffende de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals..."
  • 12:3712:37, 21 March 2024 diff hist +66 N Translations:Other corpora/17/nlCreated page with "* [https://zenodo.org/record/1035175#.YfP7IerMLZR Download pagina]"
  • 12:3712:37, 21 March 2024 diff hist +610 N Translations:Other corpora/16/nlCreated page with "== Dutch Audio Description Corpus == Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. Dit Dutch AD corpus is gebruikt om een reeks kwantitatieve data betreffende de taal van AD te extraheren, nl. frequentietellingen van delen van spraak, woorden, lemma, collocaties en de berekening van andere relevante tekststatistieken zoals..."
  • 12:2812:28, 21 March 2024 diff hist −33 Other corpora/nlCreated page with "==DBRD== De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentiment polariteitslabels. Het is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering. Daarnaast kan het worden gebruikt om een model te trainen voor tekstclassificatie, in het specifiek sentimentclassifica..."
  • 12:2712:27, 21 March 2024 diff hist +95 N Translations:Other corpora/15/nlCreated page with "*[https://benjaminvdb.github.io/DBRD/ Homepagina] *[https://github.com/benjaminvdb/DBRD GitHub]" current
  • 12:2712:27, 21 March 2024 diff hist +558 N Translations:Other corpora/14/nlCreated page with "==DBRD== De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentiment polariteitslabels. Het is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering. Daarnaast kan het worden gebruikt om een model te trainen voor tekstclassificatie, in het specifiek sentimentclassifica..."
  • 11:4411:44, 21 March 2024 diff hist +191 Other corpora/nlCreated page with "==CONDIV-corpus== Het CONDIV-corpus is een elektronisch toegankelijke, regionaal, stilistisch en diachroon gecontroleerde materiaalverzameling van ongeveer 47.000.000 woorden geschreven Nederlands, die speciaal ten behoeve van het CONDIV-project ontwikkeld werd. Om toegang te krijgen tot de data, dient u contact op te nemen met [https://www.kuleuven.be/wieiswie/nl/person/00013279 Dirk Speelman van de KU Leuven]"
  • 11:4111:41, 21 March 2024 diff hist +174 N Translations:Other corpora/13/nlCreated page with "*versie 1.0 (2009) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/dtuna_documentatie_en.pdf Paper] *[http://hdl.handle.net/10032/tm-a2-k5 Download pagina]"
  • 11:4111:41, 21 March 2024 diff hist +205 Translations:Other corpora/12/nlNo edit summary
  • 11:4111:41, 21 March 2024 diff hist +174 Translations:Other corpora/10/nlNo edit summary current
  • 11:4011:40, 21 March 2024 diff hist +124 N Translations:Other corpora/12/nlCreated page with "==D-Tuna-corpus== Het D-TUNA Corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële uitdrukkingen."
  • 11:3711:37, 21 March 2024 diff hist +210 N Translations:Other corpora/11/nlCreated page with "*versie 1.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/corea_lrec08_en.pdf Paper] *[https://corea.tst-centrale.org/ Demo] *[http://hdl.handle.net/10032/tm-a2-f9 Download pagina]"
  • 11:3611:36, 21 March 2024 diff hist +142 N Translations:Other corpora/10/nlCreated page with "==COREA-coreferentiecorpus== Het COREA-coreferentiecorpus is een corpus van Nederlandse teksten die zijn geannoteerd met coreferentierelaties."
  • 11:3511:35, 21 March 2024 diff hist −39 Other corpora/nlCreated page with "* [https://neon.niederlandistik.fu-berlin.de/static/digitaal/digitaal-11.html Corpus website]"
  • 11:3411:34, 21 March 2024 diff hist +93 N Translations:Other corpora/9/nlCreated page with "* [https://neon.niederlandistik.fu-berlin.de/static/digitaal/digitaal-11.html Corpus website]"
  • 11:3411:34, 21 March 2024 diff hist +414 N Translations:Other corpora/8/nlCreated page with "==CONDIV-corpus== Het CONDIV-corpus is een elektronisch toegankelijke, regionaal, stilistisch en diachroon gecontroleerde materiaalverzameling van ongeveer 47.000.000 woorden geschreven Nederlands, die speciaal ten behoeve van het CONDIV-project ontwikkeld werd. Om toegang te krijgen tot de data, dient u contact op te nemen met [https://www.kuleuven.be/wieiswie/nl/person/00013279 Dirk Speelman van de KU Leuven]" current
  • 11:2711:27, 21 March 2024 diff hist +24 Other corporaMarked this version for translation
  • 11:2511:25, 21 March 2024 diff hist +393 Other corporaNo edit summary
  • 11:1011:10, 21 March 2024 diff hist +22 Other corpora/nlNo edit summary
  • 11:1011:10, 21 March 2024 diff hist −1 Translations:Other corpora/3/nlNo edit summary current
  • 11:0911:09, 21 March 2024 diff hist +23 Translations:Other corpora/3/nlNo edit summary
  • 11:0911:09, 21 March 2024 diff hist −1 Other corporaNo edit summary
  • 11:0611:06, 21 March 2024 diff hist +19 Other corpora/nlNo edit summary
  • 11:0411:04, 21 March 2024 diff hist +19 Translations:Other corpora/1/nlNo edit summary current
  • 11:0411:04, 21 March 2024 diff hist +1 Other corporaNo edit summary
  • 11:0211:02, 21 March 2024 diff hist +1 Other corporaNo edit summary
  • 11:0111:01, 21 March 2024 diff hist −42 Other corpora/nlCreated page with "* [https://zenodo.org/record/4639616#.Ya4sX9DMLZR Download pagina]"
  • 11:0011:00, 21 March 2024 diff hist +66 N Translations:Other corpora/7/nlCreated page with "* [https://zenodo.org/record/4639616#.Ya4sX9DMLZR Download pagina]"
  • 11:0011:00, 21 March 2024 diff hist +622 N Translations:Other corpora/6/nlCreated page with "Het CSI-corpus is een jaarlijks uitgebreid corpus van studententeksten in twee genres: essays en reviews. Het doel van dit corpus bevindt zich met name in onderzoek naar stylometrie, maar andere toepassingen zijn ook mogelijk. Er is een uitgebreide hoeveelheid metadata beschikbaar, zowel over de auteur (gender, leeftijd, seksuele oriëntatie, regio van oorsprong, persoonlijkheidsprofiel), als ook over het document (tijdsvermelding, genre, echtheid, sentiment, cijfer). De..."
  • 10:5310:53, 21 March 2024 diff hist +9,792 N Other corpora/nlCreated page with "* versie 1.0 (2015) * [https://www.narcis.nl/research/RecordID/OND1347377 Project pagina] * [http://hdl.handle.net/10032/tm-a2-p2 Download pagina]"
  • 10:5210:52, 21 March 2024 diff hist +47 N Translations:Other corpora/5/nlCreated page with "==CLiPS Stylometry Investigation (CSI) Corpus==" current
  • 10:5110:51, 21 March 2024 diff hist +146 N Translations:Other corpora/4/nlCreated page with "* versie 1.0 (2015) * [https://www.narcis.nl/research/RecordID/OND1347377 Project pagina] * [http://hdl.handle.net/10032/tm-a2-p2 Download pagina]"
  • 10:5110:51, 21 March 2024 diff hist +124 N Translations:Other corpora/3/nlCreated page with "BasiScript is een corpus met 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool."
  • 10:5010:50, 21 March 2024 diff hist +346 N Translations:Other corpora/2/nlCreated page with "*versie 1.0 (2015) * [https://www.clinjournal.org/index.php/clinj/article/view/50 Tellings, A., Hulsbosch, M., Vermeer, A. & van den Bosch, A. (2015). BasiLex: an 11.5-million words corpus of Dutch texts written for children. Computational Linguistics in the Netherlands Journal 4, 191-208] *[http://hdl.handle.net/10032/tm-a2-n4 Download pagina]"
  • 10:5010:50, 21 March 2024 diff hist +286 N Translations:Other corpora/1/nlCreated page with "Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Het corpus bevat 13,5 miljoen tokens, waarvan 11,5 miljoen woorden. De tokens komen voor ongeveer 40% uit educatieve materialen, 40% uit kinderliteratuur en 20% uit media."
  • 10:4910:49, 21 March 2024 diff hist +14 N Translations:Other corpora/Page display title/nlCreated page with "Andere corpora" current
  • 10:4810:48, 21 March 2024 diff hist +77 Other corporaMarked this version for translation
  • 10:4810:48, 21 March 2024 diff hist +25 Other corporaNo edit summary
  • 10:4810:48, 21 March 2024 diff hist +14 TreebanksNo edit summary current
  • 10:4710:47, 21 March 2024 diff hist −93 Treebanks/nlCreated page with "Voor het Nederlands zijn we op de hoogte dat onderstaande treebanks beschikbaar zijn om te downloaden."
  • 10:4710:47, 21 March 2024 diff hist +29 N Translations:Treebanks/7/nlCreated page with "Zie ook Treebank querying" current
  • 10:4610:46, 21 March 2024 diff hist +249 N Translations:Treebanks/6/nlCreated page with "Er is een conversiescript om Alpino trees te converteren naar UD trees, [https://github.com/rug-compling/alud Alud] Beschikbaar vanaf Gihub [https://github.com/gossebouma/lassy2ud (een oudere versie, die niet langer wordt onderhouden is lassy2ud)]"
  • 10:4510:45, 21 March 2024 diff hist +905 N Treebanks/nlCreated page with "Sommige treebanks zijn ook beschikbaar in Universal Dependency format."
  • 10:4510:45, 21 March 2024 diff hist +66 N Translations:Treebanks/5/nlCreated page with "* [https://universaldependencies.org/#download Lassy/Alpino in UD]" current
  • 10:4510:45, 21 March 2024 diff hist +70 N Translations:Treebanks/4/nlCreated page with "Sommige treebanks zijn ook beschikbaar in Universal Dependency format."
  • 10:4410:44, 21 March 2024 diff hist +176 N Translations:Treebanks/3/nlCreated page with "* [https://www.let.rug.nl/~vannoord/trees/ Alpino treebank] * [https://www.let.rug.nl/~vannoord/Lassy/ Lassy treebanks] * [http://hdl.handle.net/10032/tm-a2-q6 Wablieft corpus]"
  • 10:4410:44, 21 March 2024 diff hist +102 N Translations:Treebanks/2/nlCreated page with "Voor het Nederlands zijn we op de hoogte dat onderstaande treebanks beschikbaar zijn om te downloaden."
  • 10:4310:43, 21 March 2024 diff hist +106 N Translations:Treebanks/1/nlCreated page with "Treebanks zijn doorgaans syntactisch geannoteerde corpora, ofwel handmatig, ofwel automatisch geannoteerd." current
  • 10:4110:41, 21 March 2024 diff hist +9 N Translations:Treebanks/Page display title/nlCreated page with "Treebanks" current
  • 10:4110:41, 21 March 2024 diff hist +77 TreebanksMarked this version for translation
  • 10:4110:41, 21 March 2024 diff hist +25 TreebanksNo edit summary
  • 10:4010:40, 21 March 2024 diff hist +14 PropbanksNo edit summary current
  • 10:4010:40, 21 March 2024 diff hist −128 Propbanks/nlCreated page with "==Universal Propbank== Dit project richt zich op het annoteren van teksten in verschillende talen met een laag van 'universele' semantische rollabelingannotatie. Om dit te bewerkstelligen gebruiken ze frames en rollabels van de Engelse Proposition Bank om oppervlakkige semantiek in zinnen te labelen in nieuwe doeltalen."
  • 10:3910:39, 21 March 2024 diff hist +51 N Translations:Propbanks/3/nlCreated page with "*[https://universalpropositions.github.io/ Website]" current
  • 10:3910:39, 21 March 2024 diff hist +63 N Translations:Propbanks/2/nlCreated page with "Sinds de komst van versie 2.0 bevat de Propbank ook Nederlands." current
  • 10:3910:39, 21 March 2024 diff hist +321 N Translations:Propbanks/1/nlCreated page with "==Universal Propbank== Dit project richt zich op het annoteren van teksten in verschillende talen met een laag van 'universele' semantische rollabelingannotatie. Om dit te bewerkstelligen gebruiken ze frames en rollabels van de Engelse Proposition Bank om oppervlakkige semantiek in zinnen te labelen in nieuwe doeltalen."
  • 10:3310:33, 21 March 2024 diff hist +567 N Propbanks/nlCreated page with "Propbanks"
  • 10:3210:32, 21 March 2024 diff hist +9 N Translations:Propbanks/Page display title/nlCreated page with "Propbanks" current
  • 10:3110:31, 21 March 2024 diff hist +33 PropbanksMarked this version for translation
  • 10:3110:31, 21 March 2024 diff hist +25 PropbanksNo edit summary
  • 10:3110:31, 21 March 2024 diff hist +14 Sign Language corporaNo edit summary
  • 10:3010:30, 21 March 2024 diff hist −308 Sign Language corpora/nlCreated page with "===GoSt-ParC Sign=== Een parallel corpus van authentieke Vlaamse Gebarentaal (VGT) en geschreven Nederlands dat kan worden ingezet als gouden standaard in geautomatiseerde gebarentaalvertaling."
  • 10:3010:30, 21 March 2024 diff hist +74 N Translations:Sign Language corpora/10/nlCreated page with "*[https://aclanthology.org/2023.eamt-1.54 GoST-ParC Sign korte publicatie]"
  • 10:3010:30, 21 March 2024 diff hist +193 N Translations:Sign Language corpora/9/nlCreated page with "===GoSt-ParC Sign=== Een parallel corpus van authentieke Vlaamse Gebarentaal (VGT) en geschreven Nederlands dat kan worden ingezet als gouden standaard in geautomatiseerde gebarentaalvertaling." current
  • 10:2810:28, 21 March 2024 diff hist +55 N Translations:Sign Language corpora/8/nlCreated page with "*[http://hdl.handle.net/10032/tm-a2-w7 Download pagina]"
  • 10:2810:28, 21 March 2024 diff hist +210 N Translations:Sign Language corpora/7/nlCreated page with "Een automatisch getranscribeerd en geannoteerd parallel corpus met spraak (Vlaams, Frans, Duits) en gebarentaal (VGT, LSFB) gebaseerd op persconferenties van de Belgische federale overheid betreffende COVID-19." current
  • 10:2610:26, 21 March 2024 diff hist +56 N Translations:Sign Language corpora/6/nlCreated page with "===Belgian Covid Sign Language Corpus (BeCoS Corpus) ===" current
  • 10:2510:25, 21 March 2024 diff hist +2 Translations:Sign Language corpora/3/nlNo edit summary
  • 10:2410:24, 21 March 2024 diff hist +122 N Translations:Sign Language corpora/5/nlCreated page with "* [https://www.corpusvgt.be/ Corpus website (in het Nederlands)] * [http://hdl.handle.net/10032/tm-a2-v6 Download van INT]"
  • 10:2410:24, 21 March 2024 diff hist −249 Sign Language corpora/nlCreated page with "===NGT-HoReCo=== Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 283 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de NGT-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 21.825 woorden in het N..."
  • 10:2410:24, 21 March 2024 diff hist +160 N Translations:Sign Language corpora/4/nlCreated page with "==Vlaamse Gebarentaal (VGT) == ===Corpus Vlaamse Gebarentaal=== In Vlaanderen is Vlaamse Gebarentaal officieel erkend. Een corpus is beschikbaar voor onderzoek." current
  • 10:2310:23, 21 March 2024 diff hist +590 N Translations:Sign Language corpora/3/nlCreated page with "===NGT-HoReCo=== Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 283 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de NGT-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 21.825 woorden in het N..."
  • 10:2110:21, 21 March 2024 diff hist +63 N Translations:Sign Language corpora/2/nlCreated page with "* [https://www.corpusngt.nl Corpus website (in het Nederlands)]"
  • 10:2110:21, 21 March 2024 diff hist +279 N Translations:Sign Language corpora/1/nlCreated page with "==Nederlandse Gebarentaal (NGT) == ===Corpus Nederlandse Gebarentaal=== In Nederland is Nederlandse Gebarentaal (NGT) officieel erkend. Een corpus is beschikbaar voor onderzoek. Om het te downloaden kan u contact opnemen met [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]" current
  • 10:1910:19, 21 March 2024 diff hist +2,381 N Sign Language corpora/nlCreated page with "Gebarentaal corpora"
  • 10:1810:18, 21 March 2024 diff hist 0 Translations:Sign Language corpora/Page display title/nlNo edit summary
  • 10:1810:18, 21 March 2024 diff hist +19 N Translations:Sign Language corpora/Page display title/nlCreated page with "Gebarentaal corpora"
  • 10:1310:13, 21 March 2024 diff hist +111 Sign Language corporaMarked this version for translation
  • 10:1310:13, 21 March 2024 diff hist +25 Sign Language corporaNo edit summary
  • 10:1210:12, 21 March 2024 diff hist +14 Spoken corporaNo edit summary current
  • 10:1210:12, 21 March 2024 diff hist −107 Spoken corpora/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-poi_documentatie_nl.pdf Documentatie] * [[http://lands.let.ru.nl/projects/AutonomataToo/index.php Project website] * [http://hdl.handle.net/10032/tm-a2-n7 Download pagina]"
  • 10:1110:11, 21 March 2024 diff hist +108 N Translations:Spoken corpora/22/nlCreated page with "*[https://hstrik.ruhosting.nl/bliss/ Project pagina] *[http://hdl.handle.net/10032/tm-a2-v3 Download pagina]"
  • 10:1110:11, 21 March 2024 diff hist +278 N Translations:Spoken corpora/21/nlCreated page with "==BLISS Dialogue Summaries== Deze dataset bestaat uit Nederlandse opnamen van deelnemers die praten met het BLISS-dialoogsysteem over hun alledaagse bezigheden en hun favoriete activiteiten. Het corpus bestaat uit 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden." current
  • 10:0810:08, 21 March 2024 diff hist −114 Spoken corpora/nlCreated page with "Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN)."
  • 10:0710:07, 21 March 2024 diff hist +233 N Translations:Spoken corpora/20/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/chorec_documentatie_en.pdf Paper] * [https://www.esat.kuleuven.be/psi/spraak/projects/SPACE/ Project pagina] * [http://hdl.handle.net/10032/tm-a2-j5 Download pagina]"
  • 10:0710:07, 21 March 2024 diff hist +471 N Translations:Spoken corpora/19/nlCreated page with "==Children's Oral Reading Corpus (CHOREC)== Het CHOREC-corpus bevat opgenomen, getranscribeerde en geannoteerde voorgelezen spraak (42 GB of 130 uur) van 400 Nederlandssprekende basisschoolkinderen met of zonder leesproblemen. Analyses van inter- en intra-annotatorovereenkomst zijn uitgevoerd om de consistentie waarmee leesfouten zijn gedetecteerd te onderzoeken, orthografische en fonetische transcripties zijn gemaakt, en leesfouten en leesstrategieën zijn gelabeld."
  • 10:0310:03, 21 March 2024 diff hist +213 Spoken corpora/nlCreated page with "* [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website]"
  • 10:0010:00, 21 March 2024 diff hist +245 N Translations:Spoken corpora/18/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-poi_documentatie_nl.pdf Documentatie] * [[http://lands.let.ru.nl/projects/AutonomataToo/index.php Project website] * [http://hdl.handle.net/10032/tm-a2-n7 Download pagina]"
  • 10:0010:00, 21 March 2024 diff hist +518 N Translations:Spoken corpora/17/nlCreated page with "==AUTONOMATA-POI-corpus== Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, wat heeft geresulteerd in 5677 extra geluidsbestanden. Alle uitinge..."
  • 10:0010:00, 21 March 2024 diff hist −48 Spoken corpora/nlCreated page with "== COPAS: Corpus Pathologische en Normale Spraak == Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De nodige annotaties werden voorzien."
  • 09:5909:59, 21 March 2024 diff hist +175 N Translations:Spoken corpora/16/nlCreated page with "* versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-nc_lrec2006_en.pdf Paper] * [http://hdl.handle.net/10032/tm-a2-m2 Download pagina]"
  • 09:5909:59, 21 March 2024 diff hist +233 N Translations:Spoken corpora/15/nlCreated page with "==AUTONOMATA-namencorpus== Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel."
  • 09:5809:58, 21 March 2024 diff hist −115 Spoken corpora/nlCreated page with "==SABeD -- Spoken Academic Belgian Dutch== Het SABeD corpus verzamelingsproject is begonnen op 1 maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal bestaan uit 200 colleges."
  • 09:5709:57, 21 March 2024 diff hist +95 N Translations:Spoken corpora/14/nlCreated page with "* [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website]"
  • 09:5709:57, 21 March 2024 diff hist +221 N Translations:Spoken corpora/13/nlCreated page with "==SABeD -- Spoken Academic Belgian Dutch== Het SABeD corpus verzamelingsproject is begonnen op 1 maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal bestaan uit 200 colleges."
  • 09:5609:56, 21 March 2024 diff hist +2 Spoken corpora/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist +2 Translations:Spoken corpora/12/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist −61 Spoken corpora/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist +562 N Translations:Spoken corpora/12/nlCreated page with "* 115 uur aan gesproken Nederlands * spraak van kinderen, ouderen en anderstaligen en mens-machinedialogen. * letterlijke transcriptie, een transcriptie van de mens-machine-interactiefenomen, POS tagging van de woorden, en een automatische fonetische transcriptie. * versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/jasmin_lrec2008_en.pdf Recording Speech of Children, Non-Natives and Elderly People for HLT Applications: the JASMIN-CGN C..."
  • 09:5209:52, 21 March 2024 diff hist +109 Spoken corpora/nlCreated page with "==Corpus Gesproken Nederlands== Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders."
  • 09:5009:50, 21 March 2024 diff hist +209 Translations:Spoken corpora/11/nlNo edit summary current
  • 09:5009:50, 21 March 2024 diff hist −227 Translations:Spoken corpora/11/nlNo edit summary
  • 09:4909:49, 21 March 2024 diff hist +368 N Translations:Spoken corpora/11/nlCreated page with "Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN)."
  • 09:4609:46, 21 March 2024 diff hist −111 Spoken corpora/nlCreated page with "*versie 1.0 (2001) *4.6 MB *[http://hdl.handle.net/10032/tm-a2-n8 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFAcorpus/ Project website]"
  • 09:4409:44, 21 March 2024 diff hist +23 N Translations:Spoken corpora/10/nlCreated page with "==JASMIN-spraakcorpus==" current
  • 09:4409:44, 21 March 2024 diff hist +165 N Translations:Spoken corpora/9/nlCreated page with "*versie 1.0 (2001) *4.6 MB *[http://hdl.handle.net/10032/tm-a2-n8 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFAcorpus/ Project website]"
  • 09:4309:43, 21 March 2024 diff hist +429 N Translations:Spoken corpora/8/nlCreated page with "==IFA Spoken Language Corpus== Het IFA Spoken Language Corpus is een gratis (GPL) database van handmatig gesegmenteerde gesproken Nederlands op foneem niveau. Het is samengesteld met pasklare software en gesproken Nederlands afkomstig van 8 sprekers met een verscheidenheid aan spreekstijlen. Voor een totaal van 50.000 woorden (41 minuten/spreker), duurde het vergaren en voorbereiden van spraak ongeveer drie weken per spreker."
  • 09:3709:37, 21 March 2024 diff hist +6,937 N Spoken corpora/nlCreated page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu..."
  • 09:3709:37, 21 March 2024 diff hist +588 N Translations:Spoken corpora/7/nlCreated page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu..."
  • 09:3409:34, 21 March 2024 diff hist +254 N Translations:Spoken corpora/6/nlCreated page with "De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica, frequentielijsten en de corpusexploratiesoftware Corex behoren ook tot het CGN." current
  • 09:3309:33, 21 March 2024 diff hist +200 N Translations:Spoken corpora/5/nlCreated page with "==Corpus Gesproken Nederlands== Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders." current
  • 09:3209:32, 21 March 2024 diff hist +153 N Translations:Spoken corpora/4/nlCreated page with "* Belgisch-Nederlands * [http://hdl.handle.net/10032/tm-a2-n3 Download pagina] * [https://www.esat.kuleuven.be/psi/spraak/projects/SPACE/ Project pagina]"
  • 09:3209:32, 21 March 2024 diff hist +464 N Translations:Spoken corpora/3/nlCreated page with "== COPAS: Corpus Pathologische en Normale Spraak == Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De nodige annotaties werden voorzien." current
  • 09:3109:31, 21 March 2024 diff hist +784 N Translations:Spoken corpora/2/nlCreated page with "==Boarnsterhim Corpus (BHC) (Momenteel niet beschikbaar)== Het Boarnsterhim Corpus bestaat uit 250 uur spraak in zowel West-Fries als Nederlands door dezelfde groep tweetalige sprekers. Het corpus bevat originele opnamen uit 1982-1984 en een replicerend onderzoek 35 jaar later. De dataverzameling omvat de spraak van vier generaties en combineert paneldata en trenddata. ''##Dit corpus is tijdelijk niet beschikbaar omdat er aanpassingen noodzakelijk zijn. Voor meer informa..."
  • 09:2809:28, 21 March 2024 diff hist +110 N Translations:Spoken corpora/1/nlCreated page with "Gesproken corpora zijn corpora die bestaan uit gesproken data of materiaal dat gebaseerd is op gesproken data." current
  • 09:2709:27, 21 March 2024 diff hist +17 N Translations:Spoken corpora/Page display title/nlCreated page with "Gesproken corpora" current
  • 09:2709:27, 21 March 2024 diff hist +255 Spoken corporaMarked this version for translation
  • 09:2709:27, 21 March 2024 diff hist +25 Spoken corporaNo edit summary
  • 09:2609:26, 21 March 2024 diff hist +14 Social media corporaNo edit summary current
  • 09:2609:26, 21 March 2024 diff hist −21 Social media corpora/nlCreated page with "==TwiSty Author Profiling Corpus== TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteur- profiling. Het bestaat uit personaliteits-(MBTI)-en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, als ook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de..."
  • 09:2509:25, 21 March 2024 diff hist +532 N Translations:Social media corpora/6/nlCreated page with "==TwiSty Author Profiling Corpus== TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteur- profiling. Het bestaat uit personaliteits-(MBTI)-en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, als ook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de..."
  • 09:1809:18, 21 March 2024 diff hist −29 Social media corpora/nlCreated page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd."
  • 09:1509:15, 21 March 2024 diff hist +395 N Translations:Social media corpora/5/nlCreated page with "==Whatsapp corpus Verheijen== Whatsappdata verzameld voor het promotieonderzoek van Lieke Verheijen (Radboud Universiteit). Geïnformeerde toestemming werd alleen verleend door de deelnemer aan het onderzoek en niet door de gesprekspartner. Als een gevolg daarvan bevat het subcorpus enkel bijdragen van de zender. * [https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:112987 Project website]"
  • 09:1109:11, 21 March 2024 diff hist −144 Social media corpora/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]"
  • 09:1109:11, 21 March 2024 diff hist +56 N Translations:Social media corpora/4/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]"
  • 09:1109:11, 21 March 2024 diff hist +256 N Translations:Social media corpora/3/nlCreated page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd." current
  • 09:0909:09, 21 March 2024 diff hist −1 Translations:Social media corpora/2/nlNo edit summary current
  • 09:0809:08, 21 March 2024 diff hist +487 N Translations:Social media corpora/2/nlCreated page with "* [https://github.com/tommasoc80/DALC Github] * [https://dataverse.nl/dataset.xhtml?persistentId=doi%3A10.34894%2FHOINL3 Website] * Publicatie: '''Caselli, Tommaso, Schelhaas, Arjan, Weultjes, Marieke, Leistra, Folkert, van der Veen, Hylke, Timmerman, Gerben and Nissim, Malvina''' (2021). [https://aclanthology.org/2021.woah-1.6/ DALC: the Dutch Abusive Language Corpus.] Handelingen van de 5e Workshop van Online Abuse and Harms (WOAH). Association for Computational Lingui..."
  • 09:0609:06, 21 March 2024 diff hist −56 Social media corpora/nlCreated page with "==DALC Dutch Abusive Language Corpus== The Dutch Abusive Language Corpus v1.0 (DALC v1.0)"
  • 09:0609:06, 21 March 2024 diff hist +89 N Translations:Social media corpora/1/nlCreated page with "==DALC Dutch Abusive Language Corpus== The Dutch Abusive Language Corpus v1.0 (DALC v1.0)" current

20 March 2024

19 March 2024

18 March 2024

  • 16:1116:11, 18 March 2024 diff hist +13 Manually annotated corporaNo edit summary
  • 16:1016:10, 18 March 2024 diff hist −53 Manually annotated corpora/nlCreated page with "[https://doi.org/10.1007/s10579-023-09700-0 Labat, S., Demeester, T., & Hoste, V. (2023). EmoTwiCS : a corpus for modelling emotion trajectories in Dutch customer service dialogues on Twitter.] [https://aclanthology.org/2022.wnut-1.12/ Labat, S., Hadifar, A., Demeester, T., & Hoste, V. (2022). An emotional journey : detecting emotion trajectories in Dutch customer service dialogues] [https://lt3.ugent.be/resources/emotwics/dataset-download-form/ Vraag om toegang]"
  • 16:1016:10, 18 March 2024 diff hist +471 N Translations:Manually annotated corpora/25/nlCreated page with "[https://doi.org/10.1007/s10579-023-09700-0 Labat, S., Demeester, T., & Hoste, V. (2023). EmoTwiCS : a corpus for modelling emotion trajectories in Dutch customer service dialogues on Twitter.] [https://aclanthology.org/2022.wnut-1.12/ Labat, S., Hadifar, A., Demeester, T., & Hoste, V. (2022). An emotional journey : detecting emotion trajectories in Dutch customer service dialogues] [https://lt3.ugent.be/resources/emotwics/dataset-download-form/ Vraag om toegang]" current
  • 16:0916:09, 18 March 2024 diff hist +1 Translations:Manually annotated corpora/22/nlNo edit summary
  • 16:0916:09, 18 March 2024 diff hist 0 Translations:Manually annotated corpora/24/nlNo edit summary
  • 16:0916:09, 18 March 2024 diff hist −50 Manually annotated corpora/nlCreated page with "==EmoTwiCS== EmoTwiCS is een corpus van 9,489 Nederlandse klantenservice dialogen die zijn verzameld via Twitter."
  • 16:0916:09, 18 March 2024 diff hist +113 N Translations:Manually annotated corpora/24/nlCreated page with "==EmoTwiCS== EmoTwiCS is een corpus van 9,489 Nederlandse klantenservice dialogen die zijn verzameld via Twitter."
  • 16:0816:08, 18 March 2024 diff hist −54 Manually annotated corpora/nlCreated page with "* [https://lt3.ugent.be/resources/emowoz-cs-en-nl/ Project pagina] * Labat, S., Ackaert, N., Demeester, T., & Hoste, V. (2022). Variation in the Expression and Annotation of Emotions: a Wizard of Oz Pilot Study. In G. Abercrombie, V. Basile, S. Tonelli, V. Rieser, & A. Uma (Eds.), Proceedings of the 1st Workshop on Perspectivist Approaches to NLP @LREC2022 (pp. 66–72). Marseille, France: European Language Resources Association (ELRA)"
  • 16:0816:08, 18 March 2024 diff hist +439 N Translations:Manually annotated corpora/23/nlCreated page with "* [https://lt3.ugent.be/resources/emowoz-cs-en-nl/ Project pagina] * Labat, S., Ackaert, N., Demeester, T., & Hoste, V. (2022). Variation in the Expression and Annotation of Emotions: a Wizard of Oz Pilot Study. In G. Abercrombie, V. Basile, S. Tonelli, V. Rieser, & A. Uma (Eds.), Proceedings of the 1st Workshop on Perspectivist Approaches to NLP @LREC2022 (pp. 66–72). Marseille, France: European Language Resources Association (ELRA)"
  • 16:0716:07, 18 March 2024 diff hist +49 Manually annotated corpora/nlCreated page with "* De Bruyne, L., De Clercq, O., & Hoste, V. (2021). Prospects for Dutch emotion detection: Insights from the new EmotioNL dataset. Computational Linguistics in the Netherlands Journal, 11, 231-255. * [https://lt3.ugent.be/resources/emotionl/ Info pagina (onder andere betreffende de toegang tot de corpusdata)] ==EEmoWOZ-CS EN-NL== Het EmoWOZ-corpus is een tekstuele conversationele corpus in het domein van de klantenservice, verzameld doormiddel van de Wizard of Oz-techn..."
  • 16:0616:06, 18 March 2024 diff hist +1,403 N Translations:Manually annotated corpora/22/nlCreated page with "* De Bruyne, L., De Clercq, O., & Hoste, V. (2021). Prospects for Dutch emotion detection: Insights from the new EmotioNL dataset. Computational Linguistics in the Netherlands Journal, 11, 231-255. * [https://lt3.ugent.be/resources/emotionl/ Info pagina (onder andere betreffende de toegang tot de corpusdata)] ==EEmoWOZ-CS EN-NL== Het EmoWOZ-corpus is een tekstuele conversationele corpus in het domein van de klantenservice, verzameld doormiddel van de Wizard of Oz-techn..."
  • 15:3515:35, 18 March 2024 diff hist −3 Manually annotated corpora/nlCreated page with "==EmotioNL== Het EmotioNL-corpus is een emotie-geannoteerde corpus van Nederlandse teksten. Het bestaat uit 1,000 Nederlandse tweets en 1,000 citaten uit reality TV-shows. De teksten zijn geannoteerd met de categorieën woede, angst, genot, liefde, verdriet en neutraal, en scores (Reëelwaardig gewaardeerd, tussen 0 en 1) voor de emotionele dimensievalentie, opwinding en dominantie."
  • 15:3515:35, 18 March 2024 diff hist +386 N Translations:Manually annotated corpora/21/nlCreated page with "==EmotioNL== Het EmotioNL-corpus is een emotie-geannoteerde corpus van Nederlandse teksten. Het bestaat uit 1,000 Nederlandse tweets en 1,000 citaten uit reality TV-shows. De teksten zijn geannoteerd met de categorieën woede, angst, genot, liefde, verdriet en neutraal, en scores (Reëelwaardig gewaardeerd, tussen 0 en 1) voor de emotionele dimensievalentie, opwinding en dominantie."
  • 15:2315:23, 18 March 2024 diff hist −38 Manually annotated corpora/nlCreated page with "* [https://lt3.ugent.be/media/uploads/publications/2019/8605796.pdf EventDNA: Annotation Guidelines forEntities and Events in Dutch News Texts (v1.0) Camiel Colruyt, Orphée De Clercq and Véronique Hoste] * [https://github.com/NewsDNA-LT3/.github Code voor de gebeurtenisextractie-experimenten en IAA-onderzoek] * [https://lt3.ugent.be/resources/eventdna-corpus/ Info pagina (onder andere betreffende de toegang tot de corpusdata)]"
  • 15:2215:22, 18 March 2024 diff hist +433 N Translations:Manually annotated corpora/20/nlCreated page with "* [https://lt3.ugent.be/media/uploads/publications/2019/8605796.pdf EventDNA: Annotation Guidelines forEntities and Events in Dutch News Texts (v1.0) Camiel Colruyt, Orphée De Clercq and Véronique Hoste] * [https://github.com/NewsDNA-LT3/.github Code voor de gebeurtenisextractie-experimenten en IAA-onderzoek] * [https://lt3.ugent.be/resources/eventdna-corpus/ Info pagina (onder andere betreffende de toegang tot de corpusdata)]"
  • 15:1215:12, 18 March 2024 diff hist −42 Manually annotated corpora/nlCreated page with "==EventDNA== Het EventDNA-corpus is een Nederlandstalig corpus bestaand uit 1,773 nieuwsdocumenten waarin nieuwsgebeurtenissen, entiteiten, IPTC Media Topic codes en coreferentie-links handmatig zijn geannoteerd."
  • 15:1215:12, 18 March 2024 diff hist +212 N Translations:Manually annotated corpora/19/nlCreated page with "==EventDNA== Het EventDNA-corpus is een Nederlandstalig corpus bestaand uit 1,773 nieuwsdocumenten waarin nieuwsgebeurtenissen, entiteiten, IPTC Media Topic codes en coreferentie-links handmatig zijn geannoteerd."
  • 15:0815:08, 18 March 2024 diff hist −73 Manually annotated corpora/nlCreated page with "* [https://lt3.ugent.be/media/uploads/tools/Translated_corpus_and_guidelines_ETdhZnZ.zip Download link] * Bauwelinck, N., & Lefever, E. (2020, December). Annotating Topics, Stance, Argumentativeness and Claims in Dutch Social Media Comments: A Pilot Study. In Proceedings of the 7th Workshop on Argument Mining (pp. 8-18)."
  • 15:0815:08, 18 March 2024 diff hist +322 N Translations:Manually annotated corpora/18/nlCreated page with "* [https://lt3.ugent.be/media/uploads/tools/Translated_corpus_and_guidelines_ETdhZnZ.zip Download link] * Bauwelinck, N., & Lefever, E. (2020, December). Annotating Topics, Stance, Argumentativeness and Claims in Dutch Social Media Comments: A Pilot Study. In Proceedings of the 7th Workshop on Argument Mining (pp. 8-18)."
  • 15:0715:07, 18 March 2024 diff hist +573 N Translations:Manually annotated corpora/17/nlCreated page with "==Pilot Annotation Corpus PLATOS NL-EN== Dit geannoteerde corpus bestaat uit 100 opmerkingen van Facebookgebruikers uit de zomer van 2020, op de Facebook-pagina van een populaire Vlaamse krant (Het Laatste Nieuws, https://www.facebook.com/hln.be). Dit corpus bevat zowel de originele Nederlandse opmerkingen, als een parallelle Engelse vertaling (de Google Vertalen output is ietwat aangepast voor correctheid door een moedertaalspreker). De annotatie behelst topic en aspec..."
  • 14:2914:29, 18 March 2024 diff hist −54 Manually annotated corpora/nlCreated page with "* [https://github.com/margotfonteyne/StylesNMT Download pagina] * Tezcan, A., Hoste, V., & Macken, L. (2017). SCATE taxonomy and corpus of machine translation errors. In G. C. Pastor & I. Durán-Muñoz (Eds.), Trends in E-tools and resources for translators and interpreters (Vol. 45, pp. 219–244). Brill | Rodopi."
  • 14:2914:29, 18 March 2024 diff hist +316 N Translations:Manually annotated corpora/16/nlCreated page with "* [https://github.com/margotfonteyne/StylesNMT Download pagina] * Tezcan, A., Hoste, V., & Macken, L. (2017). SCATE taxonomy and corpus of machine translation errors. In G. C. Pastor & I. Durán-Muñoz (Eds.), Trends in E-tools and resources for translators and interpreters (Vol. 45, pp. 219–244). Brill | Rodopi."
  • 14:2814:28, 18 March 2024 diff hist −35 Manually annotated corpora/nlCreated page with "==StylesNMT== Deze datacollectie bevat een Engels-Nederlandse machinevertaling van de detectiveroman "The Mysterious Affair at Styles" van Agatha Christie. De vertaling is gegenereerd in mei van 2019 door Google's Neural Machine Translation (GNMT) systeem. De complete roman (5,276 zinsparen) is handmatig geannoteerd met vertaalfouten, met gebruik van een aangepaste versie van de SCATE MT error taxonomy (Tezcan et al. 2017)."
  • 14:2814:28, 18 March 2024 diff hist +427 N Translations:Manually annotated corpora/15/nlCreated page with "==StylesNMT== Deze datacollectie bevat een Engels-Nederlandse machinevertaling van de detectiveroman "The Mysterious Affair at Styles" van Agatha Christie. De vertaling is gegenereerd in mei van 2019 door Google's Neural Machine Translation (GNMT) systeem. De complete roman (5,276 zinsparen) is handmatig geannoteerd met vertaalfouten, met gebruik van een aangepaste versie van de SCATE MT error taxonomy (Tezcan et al. 2017)."

14 March 2024

13 March 2024

  • 16:1316:13, 13 March 2024 diff hist −29 Historical corpora/nlCreated page with "Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn.(delpher.nl/kranten) De oudst overgeleverde kranten zijn gepubliceerd in 1618. Voor de Delpher-website heeft de Koninklijke Bibliotheek in Den Haag deze zeventiende-eeuwse kranten gescand. Deze scans zijn gelezen met optische tekenherkenning (OCR). OCR kon echter niet overweg met de oude lettertypen en teksten van deze kranten. Daarom heeft het Meertens Instituut een citi..."
  • 16:1216:12, 13 March 2024 diff hist +13 Historical corporaNo edit summary current
  • 16:1216:12, 13 March 2024 diff hist +377 N Translations:Historical corpora/37/nlCreated page with "== Delpher: historische kranten, tijdschriften, boeken en radio bulletins == Delpher is een gratis toegankelijke website, ontwikkeld en bestuurd door de Koninklijke Bibliotheek, met onder andere gedigitaliseerde historische Nederlandse kranten, boeken, tijdschriften en radio bulletins van bibliotheken, musea en andere erfgoedinstituties. * [https://www.delpher.nl Delpher.nl]"
  • 16:1016:10, 13 March 2024 diff hist −57 Historical corpora/nlCreated page with "Het Corpus Gysseling is de verzameling van alle 13e-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek (VMNW). Het corpus bestaat voornamelijk uit ambtelijke en literaire bronnen van teksten uit de periode 1200-1300 die bovendien in 13e-eeuwse handschriften zijn overgeleverd."
  • 16:0716:07, 13 March 2024 diff hist +61 N Translations:Historical corpora/36/nlCreated page with "* [https://dbnl.org/letterkunde/pd/index.php Download pagina]"
  • 16:0716:07, 13 March 2024 diff hist +178 N Translations:Historical corpora/35/nlCreated page with "== Publieke domein data @ DBNL == Een corpus bestaand uit boeken en teksten die behoren tot het publieke domein, beschikbaar gesteld door de Koninklijke Bibliotheek in Nederland."
  • 16:0516:05, 13 March 2024 diff hist −92 Historical corpora/nlCreated page with "==14e - 16e eeuw: Corpus Middelnederlands=="
  • 16:0316:03, 13 March 2024 diff hist +67 N Translations:Historical corpora/34/nlCreated page with "* [https://portal.clarin.inl.nl/vu-dnc/index.html Corpus webpagina]"
  • 16:0316:03, 13 March 2024 diff hist 0 Translations:Historical corpora/33/nlNo edit summary current
  • 16:0216:02, 13 March 2024 diff hist +175 N Translations:Historical corpora/33/nlCreated page with "== 20e eeuw: Het VU-DNC Corpus== Het VU-DNC Corpus is een diachroon Nederlands krantencorpus (VU Free University Dutch Newspaper Corpus). (More info onder Kranten corpora)"
  • 16:0116:01, 13 March 2024 diff hist −185 Historical corpora/nlCreated page with "*[https://taalmaterialen.ivdnt.org/download/brieven-als-buit2/ Download pagina] *[http://brievenalsbuit2.ivdnt.org/corpus-frontend/BaBa/search/ Online zoeken]"
  • 16:0116:01, 13 March 2024 diff hist +183 N Translations:Historical corpora/32/nlCreated page with "* [https://www.universiteitleiden.nl/onderzoek/onderzoeksprojecten/geesteswetenschappen/brieven-als-buit#tab-2 Project pagina] * [http://hdl.handle.net/10032/Tm-a2-a7 Download pagina]"
  • 16:0116:01, 13 March 2024 diff hist +245 N Translations:Historical corpora/31/nlCreated page with "== 17e - 19e eeuw: Brieven als Buit - Gouden Standaard == Brieven als Buit – Gouden Standaard omvat de ca. 1000 met hoofdwoordsoort en modern lemma verrijkte bestanden van het Brieven als Buit-programma, geleid door Prof. Dr. M.J. van der Wal." current
  • 15:5815:58, 13 March 2024 diff hist +158 N Translations:Historical corpora/30/nlCreated page with "*[https://taalmaterialen.ivdnt.org/download/brieven-als-buit2/ Download pagina] *[http://brievenalsbuit2.ivdnt.org/corpus-frontend/BaBa/search/ Online zoeken]"
  • 15:5815:58, 13 March 2024 diff hist +468 N Translations:Historical corpora/29/nlCreated page with "Brieven als Buit-2 is een spin-off van het onderzoeksprogramma Brieven als Buit (2008-2013) van de Universiteit Leiden. Dit corpus is een toevoeging aan het originele Brieven als Buit corpus. Het omvat meer dan 1300 Nederlandse brieven die werden buitgemaakt door kapers en in beslag werden genomen door het High Court of Admiralty gedurende de oorlogen die werden uitgevochten tussen Nederland en Engeland vanaf de tweede helft van de 17e eeuw tot de vroege 19e eeuw."
  • 15:5615:56, 13 March 2024 diff hist −2 Historical corpora/nlCreated page with "*[https://couranten.ivdnt.org/corpus-frontend/couranten/search/ Online zoeken] *[https://ivdnt.org/corpora-lexica/courantencorpus/ Project pagina]"
  • 15:5215:52, 13 March 2024 diff hist +38 N Translations:Historical corpora/28/nlCreated page with "==17e - 19e eeuw: Brieven als Buit-2==" current
  • 15:5115:51, 13 March 2024 diff hist −144 Historical corpora/nlCreated page with "Wat is Oudnederlands?"
  • 15:5115:51, 13 March 2024 diff hist +322 N Translations:Historical corpora/27/nlCreated page with "*[https://taalmaterialen.ivdnt.org/download/brieven-als-buit-2021/ Download pagina] *[http://brievenalsbuit.ivdnt.org/corpus-frontend/BaB/search/ Online zoeken] *[https://www.universiteitleiden.nl/en/research/research-projects/humanities/letters-as-loot.-towards-a-non-standard-view-on-the-history-of-dutch Project pagina]"
  • 15:5015:50, 13 March 2024 diff hist +409 N Translations:Historical corpora/26/nlCreated page with "De eerste uitgebreide sociolinguïstische analyse van de Nederlandse brieven werd gerealiseerd binnen het onderzoeksprogramma Brieven als Buit/Letters as Loot (2008-2013) van de Universiteit Leiden. Dit onderzoek richtte zich op een selectie van ongeveer duizend Nederlandse brieven vanaf de late zeventiende en de late achttiende eeuw, die werden geschreven door meer dan 700 verschillende brievenschrijvers." current
  • 15:4415:44, 13 March 2024 diff hist +941 N Translations:Historical corpora/25/nlCreated page with "Ongeveer 40.000 Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw hebben eeuwenlang onder het stof gelegen in Britse archieven. Deze zogeheten Sailing Letters zijn niet alleen vanuit het buitenland door zeelieden en anderen naar het thuisfront verstuurd. Ook vanuit Nederland bleven echtgenotes, ouders, kinderen en andere familieleden met briefverkeer in contact met hun geliefden. Veel brieven hebben hun bestemming echter niet bereikt: ze werden ti..." current
  • 15:4315:43, 13 March 2024 diff hist +36 N Translations:Historical corpora/24/nlCreated page with "==17e - 19e eeuw: Brieven als Buit==" current
  • 15:4215:42, 13 March 2024 diff hist +146 N Translations:Historical corpora/23/nlCreated page with "*[https://couranten.ivdnt.org/corpus-frontend/couranten/search/ Online zoeken] *[https://ivdnt.org/corpora-lexica/courantencorpus/ Project pagina]"
  • 15:4215:42, 13 March 2024 diff hist +98 N Translations:Historical corpora/22/nlCreated page with "De eerste online beschikbare versie van het Couranten Corpus werd openbaar gemaakt op 12 mei 2022." current
  • 15:4115:41, 13 March 2024 diff hist +172 N Translations:Historical corpora/21/nlCreated page with "In de toekomst zullen transcripties van nieuw gedigitaliseerde kranten uit de zeventiende eeuw en kranten uit de achttiende eeuw aan het Couranten Corpus worden toegevoegd." current
  • 15:4115:41, 13 March 2024 diff hist +285 N Translations:Historical corpora/20/nlCreated page with "Dit corpus bevat momenteel de inhoud van 13 kranten, 109.532 artikelen en 18.926.425 woorden. De informatie in deze kranten is van belang voor onderzoekers van verschillende disciplines, variërend van historici tot historische taalkundigen, literatuurwetenschappers en kunsthistorici." current
  • 15:4015:40, 13 March 2024 diff hist +72 Historical corpora/nlCreated page with "De teksten zijn diplomatisch uitgegeven, wat wil zeggen dat de tekst zoals die in de bronnen staat zo nauwkeurig mogelijk is weergegeven in moderne schrifttekens. Het corpus is taalkundig verrijkt met woordsoort en modern Nederlands lemma (trefwoord), om het beter doorzoekbaar te maken. De taalkundige aanvullingen zijn handmatig gecorrigeerd voor het hele corpus."
  • 15:4015:40, 13 March 2024 diff hist +909 N Translations:Historical corpora/19/nlCreated page with "Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn.(delpher.nl/kranten) De oudst overgeleverde kranten zijn gepubliceerd in 1618. Voor de Delpher-website heeft de Koninklijke Bibliotheek in Den Haag deze zeventiende-eeuwse kranten gescand. Deze scans zijn gelezen met optische tekenherkenning (OCR). OCR kon echter niet overweg met de oude lettertypen en teksten van deze kranten. Daarom heeft het Meertens Instituut een citi..."
  • 15:3515:35, 13 March 2024 diff hist +30 N Translations:Historical corpora/18/nlCreated page with "==17e eeuw: Couranten Corpus==" current
  • 15:3415:34, 13 March 2024 diff hist +216 N Translations:Historical corpora/17/nlCreated page with "*[http://hdl.handle.net/10032/tm-a2-j6 Download pagina] *[http://corpusmiddelnederlands.ivdnt.org/corpus-frontend/MNL/search/ Online zoeken] *[https://ivdnt.org/corpora-lexica/corpus-middelnederlands/ Project pagina]"
  • 15:3315:33, 13 March 2024 diff hist +213 N Translations:Historical corpora/16/nlCreated page with "Het corpus is samengesteld op basis van overwegend kritische tekstedities: wetenschappelijk verantwoorde gedrukte uitgaven. Het wordt op termijn verrijkt met woordsoort en lemma om het beter doorzoekbaar te maken."
(newest | oldest) View ( | ) (20 | 50 | 100 | 250 | 500)