K-Dutch/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "===Lexicale Resources===")
(Replaced content with "==Linguïstische resources: datasets==")
Line 47: Line 47:


<span id="Linguistic_resources:_datasets"></span>
<span id="Linguistic_resources:_datasets"></span>
<div class="mw-translate-fuzzy">
==Linguïstische resources: datasets==
* [[Krantencorpora]]: corpora die uitsluitend bestaan uit krantenteksten
* [[Parlementaire corpora]]
* [[Computerondersteundecommunicatiecorpora]]
* [[Corpora van academische teksten]]
* [[Historische corpora]]
* [[L2-leerdercorpora]]
* [[Handmatig geannoteerde corpora]]
* [[Multimodale corpora]]
* [[Parallelle corpora]]
* [[Referentiecorpora]]
* [[Socialemediacorpora]]
* [[Gesproken corpora]]
* [[Gebarentaalcorpora]]
* [[Propbanks]]: bevat semantischerollabels
* [[Treebanks]]
* [[Andere corpora]]
</div>


===[[Corpora]]===
===[[Corpora]]===
Line 88: Line 71:
===Lexicale Resources===
===Lexicale Resources===


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Lexica]]
* [[Lexica]]
* [[Dictionaries]]
* [[Dictionaries|Woordenboeken]]
* [[Conceptual Resources]]
* [[Conceptual Resources|Conceptuele Resources]]
* [[Wordlists]]
* [[Wordlists|Woordenlijsten]]
* [[Embeddings]]
* [[Embeddings]]
* [[Lexica of terminology]]
* [[Lexica of terminology|Terminologielexica]]
* [[Ontologies]]
* [[Ontologies|Ontologieën]]
</div>


===N-grams===
===N-grams===


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Character N-grams|Karakter N-grammen]]
* [[Character N-grams]]
</div>


<span id="Tools_for_Dutch"></span>
==Applicaties voor het Nederlands==
==Applicaties voor het Nederlands==


===Normalisatie===
<div lang="en" dir="ltr" class="mw-content-ltr">
===Normalisation===
</div>


* [[Formaatconversie]]
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Controleren van spelling]]
* [[Format conversion]]
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
* [[Spell checking]]
*[https://lt3.ugent.be/normalisation-demo/ Normalisatie-Demo]
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: no longer available
*[https://lt3.ugent.be/normalisation-demo/ Normalisation Demo]
</div>


<span id="Language_Learning"></span>
<div class="mw-translate-fuzzy">
===Nederlands leren===
===Nederlands leren===
*[https://schrijfassistent.be Schrijfassistent]
*[https://schrijfassistent.be Schrijfassistent]
Line 121: Line 107:
*[https://orientplus.ucll.be/ Orient+]: een serieus spel om de academische woordenschat uit te breiden
*[https://orientplus.ucll.be/ Orient+]: een serieus spel om de academische woordenschat uit te breiden
*[https://www.taalwinkel.nl/ Taalwinkel]: taaladvies
*[https://www.taalwinkel.nl/ Taalwinkel]: taaladvies
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://schrijfassistent.be Schrijfassistent]
*[http://schrijfassistent.standaard.be/ Schrijfassistent] at De Standaard
*[https://www.nedbox.be NedBox]: Online exercises to learn Dutch
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online exercises to learn Dutch
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Verbs and their combination patterns
*[https://orientplus.ucll.be/ Orient+]: A serious game to enhance academic vocabulary
*[https://www.taalwinkel.nl/ Taalwinkel]: Language Advice
</div>
<span id="Automatic_linguistic_annotation"></span>
<div class="mw-translate-fuzzy">
===Automatische taalkundige annotatie===
===Automatische taalkundige annotatie===
* [[Eenvoudige Taalverwerking]]
* [[Eenvoudige Taalverwerking]]
Line 128: Line 127:
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Tekst-mining!-->
<!--* Tekst-mining!-->
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Basic language processing]]
* [[Deep parsing]]
<!-- ===Information extraction!-->
<!--* Processing of historical variants of Dutch!-->
<!--* Text mining!-->
</div>


<span id="Speech_processing"></span>
<div class="mw-translate-fuzzy">
===Spraakverwerking===
===Spraakverwerking===
* [[Gesproken taalherkenning]]
* [[Gesproken taalherkenning]]
* [[Spraakherkenning]]
* [[Spraakherkenning]]
* Spraaksynthese
* Spraaksynthese
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Spoken Language Recognition]]
* [[Speech recognition]]
* Speech synthesis
</div>


<span id="Natural_Language_Processing"></span>
<div class="mw-translate-fuzzy">
<div class="mw-translate-fuzzy">
===Natuurlijke Taalverwerking===
===Natuurlijke Taalverwerking===
Line 147: Line 165:
</div>
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Language Modeling]]
* [[Machine translation]]
* [[Coreference resolution]]
* [[Compound splitting]]
* [[Word Sense Disambiguation]]
* [[Text classification]]
* [[Sentiment analysis]]
* [[Readability]]
* [[Clinical NLP]]
</div>
<span id="Resource_querying"></span>
<div class="mw-translate-fuzzy">
===Zoeken in bronnen===
===Zoeken in bronnen===
* [[Zoeken in een Corpus]]
* [[Zoeken in een Corpus]]
* [[Zoeken in een Treebank]]
* [[Zoeken in een Treebank]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Corpus querying]]
* [[Treebank querying]]
</div>


<span id="Text_simplification"></span>
<div class="mw-translate-fuzzy">
=== Tekstvereenvoudiging ===
=== Tekstvereenvoudiging ===


Publiek beschikbare websites:
Publiek beschikbare websites:
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
Publicly available websites:
</div>


* [https://languagetool.org/nl/herschrijvingsfunctie Uw schrijfassistent]
* [https://languagetool.org/nl/herschrijvingsfunctie Uw schrijfassistent]
Line 169: Line 214:
* [https://tolkie.nl/schrijfhulp/ Tolkie]  
* [https://tolkie.nl/schrijfhulp/ Tolkie]  


<span id="Machine_translation"></span>
<div class="mw-translate-fuzzy">
===Machinevertaling===
===Machinevertaling===
====Vertaalmachines====
====Vertaalmachines====
Line 178: Line 225:
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation van de Europese Unie]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation van de Europese Unie]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
====Translation Engines====
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
Publicly available machine translation engines from or to Dutch:
*[https://www.deepl.com/translator DeepL]
*[https://translate.google.com/ Google translate]
*[https://www.bing.com/translator Bing Microsoft translator]
*[https://www.reverso.net/ Reverso]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation from the European Union]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]
</div>


<span id="MT_Evaluation"></span>
<div class="mw-translate-fuzzy">
====Evaluatie van machinevertaling====
====Evaluatie van machinevertaling====


*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
</div>
<span id="Terminology_extraction"></span>
<div class="mw-translate-fuzzy">
===Terminologie-extractie===
===Terminologie-extractie===


* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://termtreffer.org/ Termtreffer]. Ask for login at [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminology extraction for Dutch, English, French and German. (Rigouts Terryn, A. (2021). D-TERMINE: Data-driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
</div>


<span id="Terminology_management"></span>
<div class="mw-translate-fuzzy">
===Terminologiebeheer===
===Terminologiebeheer===


* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is the EU's terminology management system. It’s the shared terminology management system of the institutions of the European Union and it contains more than 7 million terms in 26 languages covering more than 100 domains of the EU legislation.
</div>


<span id="Other"></span>
<div class="mw-translate-fuzzy">
===Andere===
===Andere===


Line 202: Line 288:
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTube content
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTube content
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicate.
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicate.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* Previously unmentioned [[CLARIN projects]] at INT
* [https://webservices.cls.ru.nl/ Language and Speech Tools] at Radboud Nijmegen. e.g. [https://webservices.cls.ru.nl/tscan T-scan], an analysis tool for dutch texts to assess the complexity of the text.
* [https://www.opener-project.eu/ OpeNER] is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is a free application for creating, editing, and converting text-based subtitle files.
* [https://youdescribe.org/ YouDescribe] is a free, web-based platform for adding audio description to YouTube content.
* [https://www.audacityteam.org/ Audacity] is an audio recording and editing software application that is open source.
</div>
<span id="Helpdesk"></span>
<div class="mw-translate-fuzzy">
==Helpdesk==
==Helpdesk==
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
For information about Dutch: If you cannot find the answers to your questions on this wiki, you can send your question to [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Your questions will be forwarded as soon as possible to the appropriate experts and you should receive an answer within two working days.
</div>


U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.


<span id="Other_Services"></span>
<div class="mw-translate-fuzzy">
==Andere Diensten==
==Andere Diensten==
* [[Beste toepassingsdocumenten en richtlijnen]]
* [[Beste toepassingsdocumenten en richtlijnen]]
Line 213: Line 320:
* [[Consulting]]
* [[Consulting]]
* [[CLARIN]] voor het Nederlands
* [[CLARIN]] voor het Nederlands
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Best practice documents and guidelines]]
* [[Internships]]
* [[Consulting]]
* [[CLARIN]] for Dutch
</div>


<span id="Questions_and_Answers"></span>
<div class="mw-translate-fuzzy">
==Vragen en Antwoorden==
==Vragen en Antwoorden==
Op de [[Q&A|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
Op de [[Q&A|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
On the [[Q&A|Questions and Answers page]] we keep track of all questions we receive concerning Dutch. This will grow into a repository of K-Dutch answers to your questions.
</div>


Merk op dat er ook een heel actieve Discord server is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j
Merk op dat er ook een heel actieve Discord server is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j

Revision as of 08:35, 30 May 2024

Other languages:

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende resources voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.

De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren servicedesk@ivdnt.org met als onderwerp K-Dutch

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Linguïstische resources: datasets

Corpora

Lexicale Resources

N-grams

Applicaties voor het Nederlands

Normalisation

Nederlands leren

Spraakverwerking

Tekstvereenvoudiging

Publiek beschikbare websites:

Publicly available websites:

Publiek beschikbare apps om te downloaden:

Niet publiek beschikbaar:

Machinevertaling

Vertaalmachines

Openbaar beschikbare vertaalmachines van of naar het Nederlands:

Translation Engines

Evaluatie van machinevertaling

Terminologie-extractie

  • Termtreffer. Vraag een login aan via terminologie@ivdnt.org.
  • D-Terminer demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
  • Termtreffer. Ask for login at terminologie@ivdnt.org.
  • D-Terminer demo. Terminology extraction for Dutch, English, French and German. (Rigouts Terryn, A. (2021). D-TERMINE: Data-driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
  • IATE (Interactive Terminology for Europe) is the EU's terminology management system. It’s the shared terminology management system of the institutions of the European Union and it contains more than 7 million terms in 26 languages covering more than 100 domains of the EU legislation.

Andere

  • Niet eerder vermelde CLARIN projects bij INT
  • Language and Speech Tools bij Radboud Nijmegen.
  • OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
  • GATE (General Architecture for Text Engineering) is een Java suite van tools oorspronkelijk ontwikkeld door University of Sheffield en wordt gebruikt voor verschillende NLP taken, zoals informatieextractie. (Dutch services in GATE Cloud).
  • Speech Repository is een online e-learning tool. Het bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
  • Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekst-gebaseerde ondertitelbestanden.
  • YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTube content
  • Audacity is een open source audio recording en editing softwareapplicate.
  • Previously unmentioned CLARIN projects at INT
  • Language and Speech Tools at Radboud Nijmegen. e.g. T-scan, an analysis tool for dutch texts to assess the complexity of the text.
  • OpeNER is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
  • GATE (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. (Dutch services in GATE Cloud).
  • Speech Repository is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
  • Subtitle Workshop is a free application for creating, editing, and converting text-based subtitle files.
  • YouDescribe is a free, web-based platform for adding audio description to YouTube content.
  • Audacity is an audio recording and editing software application that is open source.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

For information about Dutch: If you cannot find the answers to your questions on this wiki, you can send your question to servicedesk@ivdnt.org . Your questions will be forwarded as soon as possible to the appropriate experts and you should receive an answer within two working days.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

On the Questions and Answers page we keep track of all questions we receive concerning Dutch. This will grow into a repository of K-Dutch answers to your questions.

Merk op dat er ook een heel actieve Discord server is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j