K-Dutch
Mediawiki:Mainpage
Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...
K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende resources voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
- Korte versie: Steurs, Vandeghinste and Daelemans (2023). Language Report Dutch. In : Rehm, G., Way, A. (eds) European Language Equality. Cognitive Technologies. Springer, Cham.
- Langere versie: Steurs, Vandeghinste and Daelemans (2022). Report on Dutch. Project deliverable. European Language Equality.
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren servicedesk@ivdnt.org met als onderwerp K-Dutch
Taalkundige onderwerpen
Grammatica
- Phonology, Morphology and Syntax: Taalportaal
- Morfosyntaxis
- Syntactische Atlas van de Nederlandse Dialecten (SAND)
- Nederlandse beschrijvende grammatica: e-ANS
- Grambank
Lexicografie
- Nederlandse woordenboeken
- Het ELEXIS-project
- White paper: The Future of Academic Lexicography
Terminologie
- Het Expertisecentrum Nederlandstalige Terminologie
- Academische taal
- Medische terminologie
- Nederlands als wetenschapstaal
- Juridische terminologie
Spelling
- Krantencorpora: corpora die uitsluitend bestaan uit krantenteksten
- Parlementaire corpora
- Computerondersteundecommunicatiecorpora
- Corpora van academische teksten
- Historische corpora
- L2-leerdercorpora
- Handmatig geannoteerde corpora
- Multimodale corpora
- Parallelle corpora
- Referentiecorpora
- Socialemediacorpora
- Gesproken corpora
- Gebarentaalcorpora
- Propbanks: bevat semantischerollabels
- Treebanks
- Andere corpora
Lexical Resources
N-grams
Applicaties voor het Nederlands
Normalisatie
- Formaatconversie
- Controleren van spelling
- TiCCLops: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
- Normalisatie-Demo
Nederlands leren
- Schrijfassistent
- Schrijfassistent van De Standaard
- NedBox: online oefeningen om Nederlands te leren
- Oefenen.nl: online oefeningen om Nederlands te leren
- Woordcombinaties: werkwoorden en hun combinatiepatronen
- Orient+: een serieus spel om de academische woordenschat uit te breiden
- Taalwinkel: taaladvies
Automatische taalkundige annotatie
Spraakverwerking
- Gesproken taalherkenning
- Spraakherkenning
- Spraaksynthese
Natuurlijke Taalverwerking
- Taalmodellering
- Machinevertaling
- Coreferentieresolutie
- Samenstellingen splitsen
- Woordbetekenisverheldering
- Tekstclassificatie
- Sentimentanalyse
- Leesbaarheid
- Klinische NTV
Zoeken in bronnen
Tekstvereenvoudiging =
Publiek beschikbare websites:
Publiek beschikbare apps om te downloaden:
Niet publiek beschikbaar:
Machinevertaling
Vertaalmachines
Openbaar beschikbare vertaalmachines van of naar het Nederlands:
- DeepL
- Google Vertalen
- Bing Microsoftvertaler
- Reverso
- eTranslation van de Europese Unie
- MATEO No Language Left Behind
Evaluatie van machinevertaling
Terminologie-extractie
- Termtreffer. Vraag een login aan via terminologie@ivdnt.org.
- D-Terminer demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
Terminologiebeheer
- IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
Other
- Previously unmentioned CLARIN projects at INT
- Language and Speech Tools at Radboud Nijmegen. e.g. T-scan, an analysis tool for dutch texts to assess the complexity of the text.
- OpeNER is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
- GATE (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. (Dutch services in GATE Cloud).
- Speech Repository is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
- Subtitle Workshop is a free application for creating, editing, and converting text-based subtitle files.
- YouDescribe is a free, web-based platform for adding audio description to YouTube content.
- Audacity is an audio recording and editing software application that is open source.
Helpdesk
For information about Dutch: If you cannot find the answers to your questions on this wiki, you can send your question to servicedesk@ivdnt.org . Your questions will be forwarded as soon as possible to the appropriate experts and you should receive an answer within two working days.
You can also ask us for information and assistance with the use of data and tools.
Other Services
Questions and Answers
On the Questions and Answers page we keep track of all questions we receive concerning Dutch. This will grow into a repository of K-Dutch answers to your questions.
Note that there is also a very active Discord server concerning Dutch NLP: https://discord.gg/jn94Ux5j