K-Dutch/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
No edit summary
 
(82 intermediate revisions by 5 users not shown)
Line 5: Line 5:
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  


K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende resources voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].
K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].


De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in


* Korte versie (Engels): [https://link.springer.com/chapter/10.1007/978-3-031-28819-7_12https://link.springer.com/chapter/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham. <nowiki>https://doi.org/10.1007/978-3-031-28819-7_12</nowiki>
* Korte versie: [https://doi.org/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham.  
* Langere versie (Engels): [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.
* Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.


Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch.


<span id="Linguistic_topics"></span>
==Taalkundige onderwerpen==
==Taalkundige onderwerpen==


<span id="Grammar"></span>
<span id="Grammar"></span>
===[[Grammatica]]===
===[[Grammar/nl|Grammatica]]===


* [[Grammatica#Fonologie,_morfologie_en_syntaxis:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
* [[Grammar/nl#Phonology,_morphology_and_syntax:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
* [[Grammatica#Morfosyntaxis|Morfosyntaxis]]
 
* [[Grammatica#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
* [[Grammar/nl#Morfosyntaxis|Morfosyntaxis]]
* [[Grammatica#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
 
* [[Grammatica#Grambank|Grambank]]
* [[Grammar/nl#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
 
* [[Grammar/nl#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
 
* [[Grammar/nl#Grambank|Grambank]]


<span id="Lexicography"></span>
<span id="Lexicography"></span>
===[[Lexicografie]]===
===[[Lexicography/nl|Lexicografie]]===


* [[Lexicografie#Nederlandse_woordenboeken|Nederlandse woordenboeken]]
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]
* [[Lexicografie#ELEXIS|Het ELEXIS-project]]
* [[Lexicography/nl#Elexis|Het ELEXIS-project]]
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography


===[[Terminologie]]===
* [[Lexicography/nl#Elexis|Het Elexis Project]]
*[[Terminologie#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]]
 
*[[Terminologie#Academische_taal|Academische taal]]
*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
*[[Terminologie#Medische_terminologie|Medische terminologie]]
 
*[[Terminologie#Nederlands_als_wetenschapstaal|Nederlands als wetenschapstaal]]
<span id="Terminology"></span>
*[[Terminologie#Juridische_terminologie|Juridische terminologie]]
===[[Terminology/nl|Terminologie]]===
 
*[[Terminology/nl#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]]
 
*[[Terminology/nl#Academische_taal|Academische taal]]
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[[Terminology#Medical_terminology|Medical terminology]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[[Terminology#Dutch_as_a_scientific_language|Dutch as a scientific language]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[[Terminology#Legal_terminology|Legal terminology]]
</div>
 
<span id="Spelling"></span>
===[[Spelling/nl|Spelling]]===
 
*[[Spelling/nl#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]]
*[[Spelling/nl#Keurmerk_Spelling|Keurmerk Spelling]]
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[[Spelling#Spelling_Certification_Mark|Spelling Certification Mark]]
</div>
 
<span id="Linguistic_resources:_datasets"></span>
==Linguïstische taalmaterialen: datasets==
 
<span id="Corpora"></span>
===[[Corpora/nl|Corpora]]===
 
* [[Newspaper_corpora/nl| Krantencorpora]]: corpora die uitsluitend bestaan uit krantenteksten
 
* [https://kdutch.ivdnt.org/wiki/Parliamentary_corpora/nl Parlementaire corpora]
 
* [https://kdutch.ivdnt.org/wiki/Computer-mediated_communication_corpora/nl Computerondersteundecommunicatiecorpora]
 
* [https://kdutch.ivdnt.org/wiki/Corpora_of_academic_texts/nl Corpora van academische teksten]
 
* [https://kdutch.ivdnt.org/wiki/Historical_corpora/nl Historische corpora]
 
* [https://kdutch.ivdnt.org/wiki/L2_learner_corpora\nl L2-leerdercorpora]
 
* [https://kdutch.ivdnt.org/wiki/Manually_annotated_corpora/nl Handmatig geannoteerde corpora]
 
* [https://kdutch.ivdnt.org/wiki/Multimodal_corpora/nl Multimodale corpora]
 
* [https://kdutch.ivdnt.org/wiki/Parallel_corpora/nl Parallelle corpora]
 
* [https://kdutch.ivdnt.org/wiki/Reference_corpora/nl Referentiecorpora]
 
* [https://kdutch.ivdnt.org/wiki/Social_media_corpora/nl Socialemediacorpora]
 
* [https://kdutch.ivdnt.org/wiki/Spoken_corpora/nl Gesproken corpora]
 
* [https://kdutch.ivdnt.org/wiki/Sign_Language_corpora/nl Gebarentaalcorpora]
 
* [https://kdutch.ivdnt.org/wiki/Propbanks/nl Propbanks]: bevatten semantische rollen
 
* [https://kdutch.ivdnt.org/wiki/Treebanks/nl Treebanks]
 
* [https://kdutch.ivdnt.org/wiki/Other_corpora/nl Andere corpora]
 
<span id="Lexical_resources"></span>
<div class="mw-translate-fuzzy">
===Lexicale resources===
</div>
 
<div class="mw-translate-fuzzy">
* [[Lexica/nl|Lexica]]
* [[Dictionaries|Woordenboeken]]
* [[Conceptual_Resources/nl|Conceptuele resources]]
* [[Wordlists/nl|Woordenlijsten]]
* [[Embeddings/nl|Embeddings]]
* [[Lexica_of_terminology/nl|Terminologielexica]]
* [[Ontologies/nl|Ontologieën]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Dictionaries]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Conceptual resources]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Wordlists]]
</div>


===[[Spelling]]===  
<div lang="en" dir="ltr" class="mw-content-ltr">
*[[Spelling#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]]
* [[Embeddings]]
*[[Spelling#Keurmerk_Spelling|Keurmerk Spelling]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Lexica of terminology]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Ontologies]]
</div>


==Taalkundige bronnen: datasets==
===[[Corpora]]===
===[[Lexicale bronnen]]===
===N-grams===
===N-grams===
* [[Letterteken N-grams]]


* [[Character_N-grams/nl|Letterteken-N-grams]]
<span id="Tools_for_Dutch"></span>
==Applicaties voor het Nederlands==
==Applicaties voor het Nederlands==
<span id="Normalisation"></span>
===Normalisatie===
===Normalisatie===
* [[Formatconversie]]
* [[Controleren van spelling]]
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
*[https://lt3.ugent.be/normalisation-demo/ Normalisatie-Demo]


===De Nederlandse Taal leren===
<div class="mw-translate-fuzzy">
* [[Format_conversion/nl|Formaatconversie]]
* [[Spell_checking/nl|Spellingcontrole]]
* [https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Spell checking]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: no longer available
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://lt3.ugent.be/normalisation-demo/ Normalisation demo]
</div>
 
<span id="Language_Learning"></span>
===Nederlands leren===
 
*[https://schrijfassistent.be Schrijfassistent]
*[https://schrijfassistent.be Schrijfassistent]
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
Line 65: Line 187:
*[https://www.taalwinkel.nl/ Taalwinkel]: taaladvies
*[https://www.taalwinkel.nl/ Taalwinkel]: taaladvies


<div lang="en" dir="ltr" class="mw-content-ltr">
*[http://schrijfassistent.standaard.be/ Schrijfassistent] at De Standaard
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://www.nedbox.be NedBox]: Online exercises to learn Dutch
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online exercises to learn Dutch
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Verbs and their combination patterns
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://orientplus.ucll.be/ Orient+]: A serious game to enhance academic vocabulary
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://www.taalwinkel.nl/ Taalwinkel]: Language Advice
</div>
<span id="Automatic_linguistic_annotation"></span>
===Automatische taalkundige annotatie===
===Automatische taalkundige annotatie===
* [[Standaardtaalverwerking]]
 
* [[Uitgebreid ontleden]]
* [[Basic_language_processing/l|Eenvoudigetaalverwerking]]
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]]
<!-- ===Informatie-extractie!-->
<!-- ===Informatie-extractie!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Tekst-mining!-->
<!--* Tekst-mining!-->


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Deep parsing]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
<!-- ===Information extraction!-->
<!--* Processing of historical variants of Dutch!-->
<!--* Text mining!-->
</div>
<span id="Speech_processing"></span>
===Spraakverwerking===
===Spraakverwerking===
* [[Gesprokentaalherkenning]]
 
* [[Spraakherkenning]]
<div class="mw-translate-fuzzy">
* [[Spoken_Language_Recognition/nl|Gesprokentaalherkenning]]
* [[Speech_recognition/nl|Spraakherkenning]]
* Spraaksynthese
* Spraaksynthese
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Speech recognition]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* Speech synthesis
</div>
<span id="Natural_Language_Processing_(NLP)"></span>
<div class="mw-translate-fuzzy">
===Natuurlijketaalverwerking===
</div>
<div class="mw-translate-fuzzy">
* [[Language_Modeling/nl|Taalmodellering]]
* [[Machine_translation/nl|Machinevertaling]]
* [[Coreference_resolution/nl|Coreferentieresolutie]]
* [[Compound_splitting/nl|Samenstellingen splitsen]]
* [[Word_Sense_Disambiguation/nl|Woordbetekenisdesambiguering]]
* [[Text_classification/nl|Tekstclassificatie]]
* [[Sentiment_analysis/nl|Sentimentanalyse]]
* [[Readability/nl|Leesbaarheid]]
* [[Text_simplification/nl|Tekstvereenvoudiging]]
* [[Clinical_NLP/nl|Klinische NTV]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Machine translation]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Coreference resolution]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Compound splitting]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Word sense disambiguation]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Text classification]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Sentiment analysis]]
</div>
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Readability]]
</div>


===Natuurlijke Taalverwerking===
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Taalmodellering]]
* [[Text simplification]]
* [[Machinevertaling]]
</div>
* [[Coreferentieresolutie]]
* [[Scheiding van samenstelllingen]]
* [[Woordbetekenisverheldering]]
* [[Tekstclassificatie]]
* [[Sentimentanalyse]]
* [[Leesbaarheid]]
* [[Klinische NTV]]


===Bevragen van taalmaterialen===
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Corpus querying]]
* [[Clinical NLP]]
* [[Treebank querying]]
</div>
 
<span id="Resource_querying"></span>
===Zoeken in bronnen===


===Machinevertaling===
* [[Corpus_querying/nl|Zoeken in een corpus]]
====Vertaalmachines====
* [[Treebank_querying/nl|Zoeken in een treebank]]
Openbaar beschikbare vertaalmachines van of naar het Nederlands:
*[https://www.deepl.com/translator DeepL]
*[https://translate.google.com/ Google Vertalen]
*[https://www.bing.com/translator Bing Microsoftvertaler]
*[https://www.reverso.net/ Reverso]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation van de Europese Unie]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]


====Evaluatie van machinevertaling====
<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
* [[Treebank querying]]
</div>


<span id="Terminology_extraction"></span>
===Terminologie-extractie===
===Terminologie-extractie===
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)


<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminology extraction for Dutch,
English, French and German. (Rigouts Terryn, A. (2021). D-TERMINE: Data-driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
</div>
<span id="Terminology_management"></span>
===Terminologiebeheer===
===Terminologiebeheer===
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.


===Anders===
<span id="Other"></span>
* Niet eerder genoemde [[CLARIN-projecten]] bij het Instituut voor de Nederlandse Taal (INT)
===Andere===
* [https://webservices.cls.ru.nl/ Taal en Spraakapplicaties] van de Radboud Universiteit Nijmegen. bijv. [https://webservices.cls.ru.nl/tscan T-scan], een hulpmiddel voor de analyse van Nederlandse teksten waarmee de complexiteit van de tekst kan worden vastgesteld.
 
* [https://www.opener-project.eu/ OpeNER] is een taalanalyse-toolchain die (academische) onderzoekers en bedrijven helpt bij het begrijpen van natuurlijketaalanalyse. Het bestaat uit gemakkelijk te installeren, verbeteren en te configureren onderdelen om bijv. de taal van een tekst te detecteren, de polarisatie van teksten vast te stellen (sentimentanalyse), te detecteren welke onderwerpen zijn ingesloten in de tekst,... De ondersteunde taalset bestaat momenteel uit: Engels, Spaans, Italiaans, Duits en Nederlands.
* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een verzameling van Java-hulpmiddelen die oorspronkelijk zijn ontwikkeld aan de Universiteit van Sheffield en die worden gebruikt voor meerdere natuurlijketaalverwerkingstaken, waaronder informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Nederlandse diensten in GATE Cloud]).
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen.  
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learninghulpmiddel. Het bevat video-opnames van real-life speeches en op maat gemaakt pedagogisch materiaal, die de vertaler en vertalende studenten een kans bieden om te oefenen met hun vertaalvaardigheden en deze te verbeteren.
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen.  Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis applicatie voor het creëren, bewerken en omzetten van op tekst gebaseerde ondertitelingbestanden.  
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
* [https://youdescribe.org/ YouDescribe] is een gratis internetplatform voor het toevoegen van audiobeschrijving aan YouTube-content.
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
* [https://www.audacityteam.org/ Audacity] is een audio-opname- en bewerkingssoftwareapplicatie die open source is.
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://webservices.cls.ru.nl/ Language and Speech Tools] at Radboud Nijmegen. e.g. [https://webservices.cls.ru.nl/tscan T-scan], an analysis tool for dutch texts to assess the complexity of the text.
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://www.opener-project.eu/ OpeNER] is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is a free application for creating, editing, and converting text-based subtitle files.
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://youdescribe.org/ YouDescribe] is a free, web-based platform for adding audio description to YouTube content.
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://www.audacityteam.org/ Audacity] is an audio recording and editing software application that is open source.
</div>


==Helpdesk==
==Helpdesk==
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.


U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.


<span id="Other_Services"></span>
==Andere Diensten==
==Andere Diensten==
* [[Beste toepassingsdocumenten en richtlijnen]]
 
* [[Stages]]
* [[Best_practice_documents_and_guidelines/nl|Bestpracticedocumenten en -richtlijnen]]
* [[Internships/nl|Stages]]
* [[Consulting/nl|Consulting]]
* [[CLARIN/nl|CLARIN]] voor het Nederlands
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Internships]]
</div>
 
<div lang="en" dir="ltr" class="mw-content-ltr">
* [[Consulting]]
* [[Consulting]]
* [[CLARIN]] voor het Nederlands
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [[CLARIN]] for Dutch
</div>
<span id="Questions_and_Answers"></span>
==Vragen en Antwoorden==
==Vragen en Antwoorden==
Op de [[Q&A|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
 
Op de [[Q&A/nl|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
 
Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j

Latest revision as of 14:20, 13 June 2024

Other languages:

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.

De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren servicedesk@ivdnt.org met als onderwerp K-Dutch.

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Linguïstische taalmaterialen: datasets

Corpora

Lexicale resources

N-grams

Applicaties voor het Nederlands

Normalisatie

  • TiCCLops: Text-Induced Corpus Clean-up online processing system: no longer available

Nederlands leren

  • NedBox: Online exercises to learn Dutch
  • Orient+: A serious game to enhance academic vocabulary

Automatische taalkundige annotatie

Spraakverwerking

  • Speech synthesis

Natuurlijketaalverwerking

Zoeken in bronnen

Terminologie-extractie

  • Termtreffer. Vraag een login aan via terminologie@ivdnt.org.
  • D-Terminer-demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

English, French and German. (Rigouts Terryn, A. (2021). D-TERMINE: Data-driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.

Andere

  • Niet eerder vermelde CLARIN-projecten bij INT
  • Language and Speech Tools bij Radboud Nijmegen.
  • OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
  • GATE (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. (Dutch services in GATE Cloud).
  • Speech Repository is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
  • Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
  • YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
  • Audacity is een open source audio recording en editing softwareapplicatie.
  • OpeNER is a language analysis toolchain helping (academic) researchers and companies make sense out of natural language analysis”. It consist of easy to install, improve and configure components to e.g. detect the language of a text, determine polarisation of texts (sentiment analysis), detect what topics are included in the text,... The supported language set currently consists of: English, Spanish, Italian, German and Dutch.
  • GATE (General Architecture for Text Engineering) is a Java suite of tools originally developed at the University of Sheffield and it is used for many natural language processing tasks, including information extraction. (Dutch services in GATE Cloud).
  • Speech Repository is an online e-learning tool. It contains video recordings of real-life speeches and tailor-made pedagogical material speeches which give the interpreter and interpreting students an opportunity to practise and improve their interpretation skills.
  • Subtitle Workshop is a free application for creating, editing, and converting text-based subtitle files.
  • YouDescribe is a free, web-based platform for adding audio description to YouTube content.
  • Audacity is an audio recording and editing software application that is open source.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Andere Diensten

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j