User contributions for Floyd
Jump to navigation
Jump to search
21 March 2024
- 14:2114:21, 21 March 2024 diff hist +41 N Translations:Lexica/29/nl Created page with "*[http://isla.ruhosting.nl/ ISLA project]" current
- 14:2114:21, 21 March 2024 diff hist +171 N Translations:Lexica/28/nl Created page with "=== ISLA: Idiomatic expressions for Second Language Acquisition === Het ISLA-project heeft een verzameling van ongeveer 400 idiomatische uitdrukkingen en hun betekenissen." current
- 14:2014:20, 21 March 2024 diff hist +55 N Translations:Lexica/27/nl Created page with "*[http://hdl.handle.net/10032/tm-a2-h2 Download pagina]"
- 14:2014:20, 21 March 2024 diff hist +450 N Translations:Lexica/26/nl Created page with "=== e-Lex === E-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan 77.000 meerwoordsuitdrukkingen en 26.000 meerwoordslemma's." current
- 14:1914:19, 21 March 2024 diff hist +204 N Translations:Lexica/25/nl Created page with "* Versie 1.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/rbbn_handleiding1.0_nl.pdf Handleiding (in het Nederlands)] *[http://hdl.handle.net/10032/tm-a2-h4 Download pagina]"
- 14:1914:19, 21 March 2024 diff hist +183 N Translations:Lexica/24/nl Created page with "=== Referentiebestand Belgisch-Nederlands (RBBN) === Het Referentiebestand Belgisch-Nederlands bevat ca. 4000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in België."
- 14:1914:19, 21 March 2024 diff hist +202 N Translations:Lexica/23/nl Created page with "* Versie 2.0.1 (2014) *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/rbn_documentatie_nl.pdf Documentatie (in het Nederlands)] *[http://hdl.handle.net/10032/tm-a2-n2 Download pagina]"
- 14:1814:18, 21 March 2024 diff hist +162 N Translations:Lexica/22/nl Created page with "=== Referentienbestand Nederlands (RBN) === Het Referentiebestand Nederlands is een lexicon met ongeveer 50.000 trefwoorden en 90.000 vaste en vrije verbindingen."
- 14:1814:18, 21 March 2024 diff hist −971 Lexica/nl Created page with "=== BasiLex-lexicon === Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd."
- 14:1814:18, 21 March 2024 diff hist +128 N Translations:Lexica/21/nl Created page with "*[https://ivdnt.org/corpora-lexica/diamant/?highlight=diamant Informatie] *[https://diamant.ivdnt.org/diamant-ui/ Online zoeken]" current
- 14:1814:18, 21 March 2024 diff hist +543 N Translations:Lexica/20/nl Created page with "=== Diachroon seMantisch lexicon van de Nederlandse Taal - DiaMaNT === Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen wo..." current
- 14:1614:16, 21 March 2024 diff hist +15 Translations:Lexica/4/nl No edit summary current
- 14:1514:15, 21 March 2024 diff hist +364 N Translations:Lexica/19/nl Created page with "*[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_eacl046.pdf Jijkoun, V., Hofmann, K. (2009). Generating a Non-English Subjectivity Lexicon: Relations That Matter] *[https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/duoman_subjectivity-lexicon-report.pdf Documentatie] *[http://hdl.handle.net/10032/tm-a2-g9 Download pagina]"
- 14:1414:14, 21 March 2024 diff hist +252 N Translations:Lexica/18/nl Created page with "=== DuOMAn Subjectivity Lexicon === Het DuOMAn Subjectivity Lexicon bevat ongeveer 9000 werkwoorden, bijwoorden, substantieven en adjectieven waarvan aangegeven werd of ze een (zeer) negatieve, een neutrale of een (zeer) positieve gevoelswaarde hebben."
- 14:1114:11, 21 March 2024 diff hist +145 N Translations:Lexica/17/nl Created page with "* Versie 1.0 (2015) * [https://www.narcis.nl/research/RecordID/OND1347377 Projectpagina] * [http://hdl.handle.net/10032/tm-a2-f2 Download pagina]"
- 14:1014:10, 21 March 2024 diff hist +247 N Translations:Lexica/16/nl Created page with "=== BasiScript-lexicon === Het BasiScript-lexicon bevat alle lemma's van het BasiScript Corpus met aanvullende informatie. BasiScript is een corpus met 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool." current
- 14:0814:08, 21 March 2024 diff hist +396 N Translations:Lexica/15/nl Created page with "* Versie 1.0 (2015) * [https://www.clips.uantwerpen.be/00.old.drupal/clinjournal/sites/default/files/13-Tellings-etal-CLIN2014.pdf Tellings, A., Hulsbosch, M., Vermeer, A. & van den Bosch, A. (2015). BasiLex: an 11.5-million words corpus of Dutch texts written for children. Computational Linguistics in the Netherlands Journal 4, 191-208] * [http://hdl.handle.net/10032/tm-a2-k7 Download pagina]"
- 14:0814:08, 21 March 2024 diff hist +201 N Translations:Lexica/14/nl Created page with "=== BasiLex-lexicon === Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd." current
- 14:0714:07, 21 March 2024 diff hist +1,001 N Translations:Lexica/13/nl Created page with "De Nederlandse CELEX Data en subsets daarvan zijn beschikbaar bij ELRA (kosten zijn van toepassing) * [http://catalog.elra.info/product_info.php?products_id=439 Download pagina CELEX Dutch lexical database - Complete set] * [http://catalog.elra.info/product_info.php?products_id=443 Download pagina CELEX Dutch lexical database - Derivational Morphology Subset] *[http://catalog.elra.info/product_info.php?products_id=445 Download pagina CELEX Dutch lexical database - Frequ..."
- 14:0514:05, 21 March 2024 diff hist +50 N Translations:Lexica/12/nl Created page with "* [http://portal.clarin.inl.nl/webcelex/ WebCelex]" current
- 14:0514:05, 21 March 2024 diff hist +275 N Translations:Lexica/11/nl Created page with "=== CELEX and WebCelex === Interface waarmee de CELEX-lexicale databases van het Duits, Engels, Nederlands kunnen worden geraadpleegd. Voor iedere taal zijn de lemma's aangevuld met orthografische, fonologische, morfologische en syntactische informatie en frequentiegegevens." current
- 14:0114:01, 21 March 2024 diff hist −56 Lexica/nl Created page with "De standaardmodules van GiGaNT Hilex zijn beschikbaar gemaakt doormiddel van een lexicon-service. Als u gebruik wilt maken van deze service, neem dan contact op met [mailto://katrien.depuydt@ivdnt.org Katrien Depuydt]."
- 14:0114:01, 21 March 2024 diff hist +58 N Translations:Lexica/10/nl Created page with "*[https://cental.uclouvain.be/cefrlex/nt2lex Bron website]"
- 14:0014:00, 21 March 2024 diff hist +346 N Translations:Lexica/9/nl Created page with "=== NT2Lex === NT2Lex is een lexicale database voor het Nederlands als een buitenlandse taal (NT2) en bevat frequentieverdelingen van in teksten waargenomen woorden die zijn becijferd op basis van de zes-niveaus tellende schaal van het Common European Framework of Reference for Languages. Beschikbaar om online te doorzoeken en om te downloaden."
- 13:5613:56, 21 March 2024 diff hist −110 Lexica/nl Created page with "*[http://diamant.ivdnt.org/diamant-ui/ Weblink] *[https://ivdnt.org/corpora-lexica/diamant/#diamant Projectbeschrijving]"
- 13:5413:54, 21 March 2024 diff hist +132 N Translations:Lexica/8/nl Created page with "*[https://ivdnt.org/corpora-lexica/gigant/ Projectbeschrijving] *[http://hdl.handle.net/10032/tm-a2-u7 Download pagina GiGaNT-Molex]"
- 13:5413:54, 21 March 2024 diff hist +73 N Translations:Lexica/7/nl Created page with "GiGaNT Molex versie 1.0 is uitgegeven en is beschikbaar om te downloaden."
- 13:5413:54, 21 March 2024 diff hist +15,839 N Lexica/nl Created page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora."
- 13:5313:53, 21 March 2024 diff hist +219 N Translations:Lexica/6/nl Created page with "De standaardmodules van GiGaNT Hilex zijn beschikbaar gemaakt doormiddel van een lexicon-service. Als u gebruik wilt maken van deze service, neem dan contact op met [mailto://katrien.depuydt@ivdnt.org Katrien Depuydt]." current
- 13:5113:51, 21 March 2024 diff hist +236 N Translations:Lexica/5/nl Created page with "Het lexicon heeft twee hoofdmodules: GiGaNT-Hilex, de historische lexiconcomponent, gebaseerd op het materiaal van de historische woordenboeken van het INT, en GiGaNT-Molex, de moderne lexiconcomponent, met materiaal uit de INT-corpora." current
- 13:5113:51, 21 March 2024 diff hist +370 N Translations:Lexica/4/nl Created page with "Op dit moment ontwikkelt het Instituut voor de Nederlandse Taal (INT) een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon, met de naam GiGaNT, vormt straks een verzameling van woorden en woordgroepen, waaronder named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten."
- 13:5013:50, 21 March 2024 diff hist +120 N Translations:Lexica/3/nl Created page with "*[http://diamant.ivdnt.org/diamant-ui/ Weblink] *[https://ivdnt.org/corpora-lexica/diamant/#diamant Projectbeschrijving]" current
- 13:5013:50, 21 March 2024 diff hist +704 N Translations:Lexica/2/nl Created page with "=== DiaMaNT === Met DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) bouwt het Instituut voor de Nederlandse Taal (INT) aan een computationeel semantisch lexicon dat diachrone semantische informatie moet bieden. Het wordt gebouwd als laag bovenop GiGaNT (een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot nu), door betekenisinformatie toe te voegen. DiaMaNT legt relaties tussen woordvormen en betekeniseenheden (concepten) en plaatst z..." current
- 13:4813:48, 21 March 2024 diff hist +22 N Translations:Lexica/1/nl Created page with "== Eentalige Lexica ==" current
- 13:4713:47, 21 March 2024 diff hist +6 N Translations:Lexica/Page display title/nl Created page with "Lexica" current
- 13:4613:46, 21 March 2024 diff hist +651 Lexica Marked this version for translation
- 13:4613:46, 21 March 2024 diff hist +25 Lexica No edit summary
- 13:3713:37, 21 March 2024 diff hist +14 Other corpora No edit summary
- 13:3713:37, 21 March 2024 diff hist −108 Other corpora/nl Created page with "* [http://gigacorpus.nl/ Project website] *"
- 13:3613:36, 21 March 2024 diff hist −2 Translations:Other corpora/40/nl No edit summary
- 13:3613:36, 21 March 2024 diff hist +43 N Translations:Other corpora/40/nl Created page with "* [http://gigacorpus.nl/ Project website] *"
- 13:3613:36, 21 March 2024 diff hist +432 N Translations:Other corpora/39/nl Created page with "== Dutch Gigacorpus == Met 234GB aan gevarieerde platte tekst, maarliefst 40 miljard tokens, is dit in ieder geval het grootste Nederlandse corpus. Maar daarnaast is dit corpus ook vrij beschikbaar en de kwaliteit is relatief hoog voor zijn omvang, zorg is gedragen voor het zo schoon mogelijk krijgen van de data. Ook bevat het corpus 400 miljoen forumposts in 10 miljoen threads met hun timestamp intact voor taalkundig onderzoek."
- 13:3513:35, 21 March 2024 diff hist −542 Other corpora/nl Created page with "*[https://data.statmt.org/cc-100/ Corpus website met downloadlinks per taal] *[https://www.aclweb.org/anthology/2020.acl-main.747 Paper webpagina] *[https://aclanthology.org/2020.lrec-1.494/ Paper webpagina]"
- 13:3513:35, 21 March 2024 diff hist +207 N Translations:Other corpora/38/nl Created page with "*[https://data.statmt.org/cc-100/ Corpus website met downloadlinks per taal] *[https://www.aclweb.org/anthology/2020.acl-main.747 Paper webpagina] *[https://aclanthology.org/2020.lrec-1.494/ Paper webpagina]"
- 13:3413:34, 21 March 2024 diff hist +251 N Translations:Other corpora/37/nl Created page with "==CC-100 Corpus== Dit corpus is een poging om de dataset die wordt gebruikt voor het trainen van XLM-R opnieuw te creëren. Dit corpus bestaat uit eentalige data voor 100+ talen en bevat daarnaast data voor geromaniseerde talen (aangegeven door *_rom)" current
- 13:2513:25, 21 March 2024 diff hist −41 Other corpora/nl Created page with "==Named Entity Recognition CoNLL2002== Spaanse en Nederlandse data met named entity labels. De Nederlandse data bestaat uit vier edities van de Belgische krant 'De Morgen' uit 2000 (2 juni, 1 juli, 1 augustus en 1 september). Voor de Nederlandse data heeft de annotator zo goed als mogelijk de MITRE en SAIC-richtlijnen voor named entity recognition (Chinchor et al.,1999) gevolgd. *[https://huggingface.co/datasets/conll2002 CoNLL2002 Dataset]"
- 13:2513:25, 21 March 2024 diff hist +445 N Translations:Other corpora/36/nl Created page with "==Named Entity Recognition CoNLL2002== Spaanse en Nederlandse data met named entity labels. De Nederlandse data bestaat uit vier edities van de Belgische krant 'De Morgen' uit 2000 (2 juni, 1 juli, 1 augustus en 1 september). Voor de Nederlandse data heeft de annotator zo goed als mogelijk de MITRE en SAIC-richtlijnen voor named entity recognition (Chinchor et al.,1999) gevolgd. *[https://huggingface.co/datasets/conll2002 CoNLL2002 Dataset]"
- 13:2113:21, 21 March 2024 diff hist −34 Other corpora/nl Created page with "*[https://doi.org/10.5281/zenodo.1035175 Webpagina] *[https://doi.org/10.5281/zenodo.1035175 Paper]"
- 13:2113:21, 21 March 2024 diff hist +99 N Translations:Other corpora/35/nl Created page with "*[https://doi.org/10.5281/zenodo.1035175 Webpagina] *[https://doi.org/10.5281/zenodo.1035175 Paper]" current
- 13:2113:21, 21 March 2024 diff hist +525 N Translations:Other corpora/34/nl Created page with "==Dutch Audio Description Corpus== Het Dutch Audio Description-corpus bevat de getranscribeerde teksten van 39 audio-beschreven Nederlandse films en tv-series. In totaal bevat het corpus 154.570 woorden en 3.074 minuten aan video. De data bestaat uit de corpusbestanden (XML-bestanden) van de getranscribeerde audiobeschrijvingen, de multimodale concordantie die is ontwikkeld voor het project en de rauwe data die is geëxtraheerd uit het corpus als onderdeel van het promo..."