K-Dutch/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Updating to match new version of source page)
(Updating to match new version of source page)
 
(82 intermediate revisions by 4 users not shown)
Line 1: Line 1:
<languages/>
<languages/>
<div lang="en" dir="ltr" class="mw-content-ltr">
<span style="color:white">Mediawiki:Mainpage</span><br>
<span style="color:white">Mediawiki:Mainpage</span><br>
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
[[File:K-centre-logo.jpg|frameless|right]]
[[File:K-centre-logo.jpg|frameless|right]]
Welcome to [[K-Dutch]], the place for anyone who wants to know anything about the Dutch language: linguistic properties, language advice, available tools and resources, etymology, dialects...
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].
K-Dutch is a [https://www.clarin.eu/content/knowledge-centres CLARIN Knowledge Centre]. It is hosted by the [https://www.ivdnt.org Instituut voor de Nederlandse Taal] (Dutch Language Institute) , which is also a [https://www.clarin.eu/content/certified-centres CLARIN-B centre] and host of many resources for Dutch, which are, in general, freely available for research purposes. K-Dutch is an initiative of [https://www.clarin.eu CLARIN-ERIC] and [https://clarin-be.ivdnt.org CLARIN-BE].
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
The status of Dutch with respect to language technologies is described in
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* Korte versie: [https://doi.org/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham.  
* Short version: [https://doi.org/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham.  
* Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.
* Longer version: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren ([mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]) met als onderwerp K-Dutch.
You are most welcome to contribute to these pages, please contact [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] with as subject K-Dutch, and we will be in touch.
==Linguisitic topics==
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Linguistic_topics"></span>
===[[Grammar]]===
==Taalkundige onderwerpen==
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Grammar"></span>
* [[Grammar#Phonology,_Morphology_and_Syntax:_Taalportaal|Phonology, Morphology and Syntax: Taalportaal]]
===[[Grammar/nl|Grammatica]]===
* [[Grammar#Morphosyntax|Morphosyntax]]
* [[Grammar#Syntactic_Atlas_of_the_Dutch_dialects_(SAND)|Syntactic Atlas of the Dutch dialects (SAND)]]
* [[Grammar#Dutch_descriptive_grammar:_e-ANS_(in_Dutch)|Dutch descriptive grammar: e-ANS (in Dutch)]]
* [[Grammar#Grambank|Grambank]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Grammar/nl#Phonology,_morphology_and_syntax:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
===[[Lexicography]]===
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Grammar/nl#Morfosyntaxis|Morfosyntaxis]]
* [[Lexicography#Dutch_dictionaries|Dutch dictionaries]]
* [[Lexicography#Elexis|The Elexis Project]]
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Grammar/nl#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
===[[Terminology]]===
*[[Terminology#Centre_of_Expertise_for_Dutch_Terminology|The Centre of Expertise for Dutch Terminology]]
*[[Terminology#Academic_Language|Academic Language]]
*[[Terminology#Medical_Terminology|Medical Terminology]]
*[[Terminology#Dutch_as_a_scientific_language|Dutch as a scientific language]]
*[[Terminology#Legal_Terminology|Legal Terminology]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Grammar/nl#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
===[[Spelling]]===
*[[Spelling#Woordenlijst.org_(Official_Dutch_Word_List)|Woordenlijst.org (Official Dutch Word List)]]
*[[Spelling#Spelling_Certification_Mark|Spelling Certification Mark]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Grammar/nl#Grambank|Grambank]]
==Linguistic resources: datasets==
===[[Corpora]]===
* [[Newspaper corpora]]: corpora exclusively consisting of newspaper text
* [[Parliamentary corpora]]
* [[Computer-mediated communication corpora]]
* [[Corpora of academic texts]]
* [[Historical corpora]]
* [[L2 learner corpora]]
* [[Manually annotated corpora]]
* [[Multimodal corpora]]
* [[Parallel corpora]]
* [[Reference corpora]]
* [[Social media corpora]]
* [[Spoken corpora]]
* [[Sign Language corpora]]
* [[Propbanks]]: contains semantic role labels
* [[Treebanks]]
* [[Other corpora]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Lexicography"></span>
===Lexical Resources===
===[[Lexicography/nl|Lexicografie]]===
* [[Lexica]]
 
* [[Dictionaries]]
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]
* [[Conceptual Resources]]
 
* [[Wordlists]]
* [[Lexicography/nl#Elexis|Het Elexisproject]]
* [[Embeddings]]
 
* [[Lexica of terminology]]
*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
* [[Ontologies]]
 
</div>
<span id="Terminology"></span>
===[[Terminology/nl|Terminologie]]===
 
*[[Terminology/nl#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]]
 
*[[Terminology/nl#Academische_taal|Academische taal]]
 
*[[Terminology/nl#Medische_terminologie|Medische terminologie]]
 
*[[Terminology/nl#Nederlands_als_wetenschapstaal|Nederlands als wetenschapstaal]]
 
*[[Terminology/nl#Juridische_terminologie|Juridische terminologie]]
 
<span id="Spelling"></span>
===[[Spelling/nl|Spelling]]===
 
*[[Spelling/nl#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]]
 
*[[Spelling/nl#Spelling_Certification_Mark|Keurmerk Spelling]]
 
<span id="Linguistic_resources:_datasets"></span>
==Linguïstische taalmaterialen: datasets==
 
<span id="Corpora"></span>
===[[Corpora/nl|Corpora]]===
 
<span id="Lexical_resources"></span>
===Lexicale resources===
 
* [[Lexica/nl|Lexica]]
 
* [[Dictionaries|Woordenboeken]]
 
* [[Conceptual_resources/nl|Conceptuele resources]]
 
* [[Wordlists/nl|Woordenlijsten]]
 
* [[Embeddings/nl|Embeddings]]
 
* [[Lexica_of_terminology/nl|Terminologielexica]]
 
* [[Ontologies/nl|Ontologieën]]


<div lang="en" dir="ltr" class="mw-content-ltr">
===N-grams===
===N-grams===
* [[Character N-grams]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Character_N-grams/nl|Letterteken-N-grams]]
==Tools for Dutch==
 
===Normalisation===
<span id="Tools_for_Dutch"></span>
* [[Format conversion]]
==Applicaties voor het Nederlands==
* [[Spell checking]]
 
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: no longer available
<span id="Normalisation"></span>
*[https://lt3.ugent.be/normalisation-demo/ Normalisation Demo]
===Normalisatie===
</div>
 
* [[Format_conversion/nl|Formaatconversie]]
 
* [[Spell_checking/nl|Spellingcontrole]]
 
* [https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
 
* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]
 
<span id="Language_Learning"></span>
===Nederlands leren===


<div lang="en" dir="ltr" class="mw-content-ltr">
===Language Learning===
*[https://schrijfassistent.be Schrijfassistent]
*[https://schrijfassistent.be Schrijfassistent]
*[http://schrijfassistent.standaard.be/ Schrijfassistent] at De Standaard
*[https://www.nedbox.be NedBox]: Online exercises to learn Dutch
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online exercises to learn Dutch
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Verbs and their combination patterns
*[https://orientplus.ucll.be/ Orient+]: A serious game to enhance academic vocabulary
*[https://www.taalwinkel.nl/ Taalwinkel]: Language Advice
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
===Automatic linguistic annotation===
* [[Basic language processing]]
* [[Deep parsing]]
<!-- ===Information extraction!-->
<!--* Processing of historical variants of Dutch!-->
<!--* Text mining!-->
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://www.nedbox.be NedBox]: Online oefening om Nederlands te leren
===Speech processing===
* [[Spoken Language Recognition]]
* [[Speech recognition]]
* Speech synthesis
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online oefeningen om Nederlands te leren
===Natural Language Processing===
* [[Language Modeling]]
* [[Machine translation]]
* [[Coreference resolution]]
* [[Compound splitting]]
* [[Word Sense Disambiguation]]
* [[Text classification]]
* [[Sentiment analysis]]
* [[Readability]]
* [[Clinical NLP]]
* [[Topic Modelling]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Werkwoorden en hun combinatiepatronen
===Resource querying===
* [[Corpus querying]]
* [[Treebank querying]]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://orientplus.ucll.be/ Orient+]: Een serious game om academische woordenschat te verbeteren
===Text simplification ===
Publicly available websites:
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://www.taalwinkel.nl/ Taalwinkel]: Taaladvies
* [https://languagetool.org/nl/herschrijvingsfunctie Uw schrijfassistent]
* [https://neuralwriter.com/nl/ Neural Writer]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Automatic_linguistic_annotation"></span>
Publicly available apps to download:
===Automatische taalkundige annotatie===
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Basic_language_processing/nl|Eenvoudigetaalverwerking]]
* [https://www.leessimpel.nl/ Lees Simpel App]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]]
Not publicly available:
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<!-- ===Informatie-extractie!-->
* [https://www2.deloitte.com/nl/nl/pages/customer-and-marketing/solutions/simone.html Simone]
<!--* Het verwerken van historische varianten van het Nederlands!-->
* [https://tscan.hum.uu.nl/tscan/ T-scan]
<!--* Tekst-mining!-->
</div>  


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Speech_processing"></span>
* [https://tolkie.nl/schrijfhulp/ Tolkie]
===Spraakverwerking===
</div>  


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Spoken_language_recognition/nl|Gesprokentaalherkenning]]
===Machine translation===
====Translation Engines====
Publicly available machine translation engines from or to Dutch:
*[https://www.deepl.com/translator DeepL]
*[https://translate.google.com/ Google translate]
*[https://www.bing.com/translator Bing Microsoft translator]
*[https://www.reverso.net/ Reverso]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation from the European Union]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Speech_recognition/nl|Spraakherkenning]]
====MT Evaluation====
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* Spraaksynthese
===Terminology extraction===
* [https://termtreffer.org/ Termtreffer]. Ask for login at [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminology extraction for Dutch, English, French and German. (Rigouts Terryn, A. (2021). D-TERMINE: Data-driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Natural_Language_Processing_(NLP)"></span>
===Terminology management===
===Natuurlijketaalverwerking (NTV)===
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is the EU's terminology management system. It’s the shared terminology management system of the institutions of the European Union and it contains more than 7 million terms in 26 languages covering more than 100 domains of the EU legislation.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Language_modeling/nl|Taalmodellering]]
===Other===
 
* Previously unmentioned [[CLARIN projects]] at INT
* [[Machine_translation/nl|Machinevertaling]]
* [https://webservices.cls.ru.nl/ Language and Speech Tools] at Radboud Nijmegen. e.g. [https://webservices.cls.ru.nl/tscan T-scan], an analysis tool for dutch texts to assess the complexity of the text.
 
* [https://www.opener-project.eu/ OpeNER] is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
* [[Coreference_resolution/nl|Coreferentieresolutie]]
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
 
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
* [[Compound_splitting/nl|Samenstellingen splitsen]]
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is a free application for creating, editing, and converting text-based subtitle files.  
 
* [https://youdescribe.org/ YouDescribe] is a free, web-based platform for adding audio description to YouTube content.
* [[Word_sense_disambiguation/nl|Woordbetekenisdesambiguering]]
* [https://www.audacityteam.org/ Audacity] is an audio recording and editing software application that is open source.
 
</div>
* [[Text_classification/nl|Tekstclassificatie]]
 
* [[Sentiment_analysis/nl|Sentimentanalyse]]
 
* [[Readability/nl|Leesbaarheid]]
 
* [[Text_simplification/nl|Tekstvereenvoudiging]]
 
* [[Clinical_NLP/nl|Klinische NTV]]
 
<span id="Resource_querying"></span>
===Zoeken in bronnen===
 
* [[Corpus_querying/nl|Zoeken in een corpus]]
 
* [[Treebank_querying/nl|Zoeken in een treebank]]
 
<span id="Terminology_extraction"></span>
===Terminologie-extractie===
 
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
 
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
 
<span id="Terminology_management"></span>
===Terminologiebeheer===
 
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
 
<span id="Other"></span>
===Andere===
 
* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT
 
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen.
 
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
 
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
 
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
 
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.  
 
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
 
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.


<div lang="en" dir="ltr" class="mw-content-ltr">
==Helpdesk==
==Helpdesk==
For information about Dutch: If you cannot find the answers to your questions on this wiki, you can send your question to [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Your questions will be forwarded as soon as possible to the appropriate experts and you should receive an answer within two working days.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
You can also ask us for information and assistance with the use of data and tools.
 
</div>
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.
 
<span id="Other_Services"></span>
==Andere Diensten==
 
* [[Best_practice_documents_and_guidelines/nl|Bestpracticedocumenten en -richtlijnen]]
 
* [[Internships/nl|Stages]]
 
* [[Consulting/nl|Consulting]]
 
* [[CLARIN/nl|CLARIN]] voor het Nederlands


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="Questions_and_Answers"></span>
==Other Services==
==Vragen en Antwoorden==
* [[Best practice documents and guidelines]]
* [[Internships]]
* [[Consulting]]
* [[CLARIN]] for Dutch
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
Op de [[Q&A/nl|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
==Questions and Answers==
On the [[Q&A|Questions and Answers page]] we keep track of all questions we receive concerning Dutch. This will grow into a repository of K-Dutch answers to your questions.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j
Note that there is also a very active Discord server concerning Dutch NLP: https://discord.gg/jn94Ux5j
</div>

Latest revision as of 07:53, 16 July 2024

Other languages:

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.

De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren (servicedesk@ivdnt.org) met als onderwerp K-Dutch.

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Linguïstische taalmaterialen: datasets

Corpora

Lexicale resources

N-grams

Applicaties voor het Nederlands

Normalisatie

  • TiCCLops: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar

Nederlands leren

  • NedBox: Online oefening om Nederlands te leren
  • Oefenen.nl: Online oefeningen om Nederlands te leren
  • Orient+: Een serious game om academische woordenschat te verbeteren

Automatische taalkundige annotatie


Spraakverwerking

  • Spraaksynthese

Natuurlijketaalverwerking (NTV)

Zoeken in bronnen

Terminologie-extractie

  • D-Terminer-demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.

Andere

  • OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
  • GATE (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. (Dutch services in GATE Cloud).
  • Speech Repository is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
  • Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
  • YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
  • Audacity is een open source audio recording en editing softwareapplicatie.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Andere Diensten

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j