K-Dutch/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
No edit summary
(Updating to match new version of source page)
 
(31 intermediate revisions by 3 users not shown)
Line 12: Line 12:
* Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.
* Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.


Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren ([mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]) met als onderwerp K-Dutch.


<span id="Linguistic_topics"></span>
==Taalkundige onderwerpen==
==Taalkundige onderwerpen==


Line 19: Line 20:
===[[Grammar/nl|Grammatica]]===
===[[Grammar/nl|Grammatica]]===


* [[Grammar/nl#Phonology,_Morphology_and_Syntax:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
* [[Grammar/nl#Phonology,_morphology_and_syntax:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
 
* [[Grammar/nl#Morfosyntaxis|Morfosyntaxis]]
* [[Grammar/nl#Morfosyntaxis|Morfosyntaxis]]
* [[Grammar/nl#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
* [[Grammar/nl#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
* [[Grammar/nl#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
* [[Grammar/nl#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
* [[Grammar/nl#Grambank|Grambank]]
* [[Grammar/nl#Grambank|Grambank]]


Line 29: Line 34:


* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]
* [[Lexicography/nl#Elexis|Het ELEXIS-project]]
 
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
* [[Lexicography/nl#Elexis|Het Elexisproject]]
 
*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography


<span id="Terminology"></span>
<span id="Terminology"></span>
Line 36: Line 43:


*[[Terminology/nl#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]]
*[[Terminology/nl#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]]
*[[Terminology/nl#Academische_taal|Academische taal]]
*[[Terminology/nl#Academische_taal|Academische taal]]
*[[Terminology/nl#Medische_terminologie|Medische terminologie]]
*[[Terminology/nl#Medische_terminologie|Medische terminologie]]
*[[Terminology/nl#Nederlands_als_wetenschapstaal|Nederlands als wetenschapstaal]]
*[[Terminology/nl#Nederlands_als_wetenschapstaal|Nederlands als wetenschapstaal]]
*[[Terminology/nl#Juridische_terminologie|Juridische terminologie]]
*[[Terminology/nl#Juridische_terminologie|Juridische terminologie]]


===[[Spelling]]===  
<span id="Spelling"></span>
===[[Spelling/nl|Spelling]]===  


*[[Spelling/nl#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]]
*[[Spelling/nl#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]]
*[[Spelling/nl#Keurmerk_Spelling|Keurmerk Spelling]]
 
*[[Spelling/nl#Spelling_Certification_Mark|Keurmerk Spelling]]


<span id="Linguistic_resources:_datasets"></span>
<span id="Linguistic_resources:_datasets"></span>
==Linguïstische resources: datasets==
==Linguïstische taalmaterialen: datasets==


<span id="Corpora"></span>
<span id="Corpora"></span>
===[[Corpora/nl|Corpora]]===
===[[Corpora/nl|Corpora]]===


* [[Corpora/nl#Newspaper_corpora|Krantencorpora]]: corpora die uitsluitend bestaan uit krantenteksten
<span id="Lexical_resources"></span>
* [[Corpora/nl#Parliamentary_corpora|Parlementaire corpora]]
===Lexicale resources===
* [[Corpora/nl#Computer-_mediated_communication_corpora|Computerondersteundecommunicatiecorpora]]
* [[Corpora/nl#Corpora_of_academic_texts|Corpora van academische teksten]]
* [[Corpora/nl#Historical_corpora|Historische corpora]]
* [[Corpora/nl#L2_learner_corpora|L2-leerdercorpora]]
* [[Corpora/nl#Manually_annotated_corpora|Handmatig geannoteerde corpora]]
* [[Corpora/nl#Multimodal_corpora|Multimodale corpora]]
* [[Corpora/nl#Parallel_corpora|Parallelle corpora]]
* [[Corpora/nl#Reference_corpora|Referentiecorpora]]
* [[Corpora/nl#Social_media_corpora|Socialemediacorpora]]
* [[Corpora/nl#Spoken_corpora|Gesproken corpora]]
* [[Corpora/nl#Sign_Language_corpora|Gebarentaalcorpora]]
* [[Corpora/nl#Propbanks|Propbanks]]: bevat semantischerollabels
* [[Corpora/nl#Treebanks|Treebanks]]
* [[Corpora/nl#Other_corpora|Andere corpora]]


<span id="Lexical_Resources"></span>
* [[Lexica/nl|Lexica]]
===Lexicale resources===


* [[Lexica]]
* [[Dictionaries|Woordenboeken]]
* [[Dictionaries|Woordenboeken]]
* [[Conceptual Resources|Conceptuele resources]]
 
* [[Wordlists|Woordenlijsten]]
* [[Conceptual_resources/nl|Conceptuele resources]]
* [[Embeddings]]
 
* [[Lexica of terminology|Terminologielexica]]
* [[Wordlists/nl|Woordenlijsten]]
* [[Ontologies|Ontologieën]]
 
* [[Embeddings/nl|Embeddings]]
 
* [[Lexica_of_terminology/nl|Terminologielexica]]
 
* [[Ontologies/nl|Ontologieën]]


===N-grams===
===N-grams===
Line 91: Line 93:


* [[Format_conversion/nl|Formaatconversie]]
* [[Format_conversion/nl|Formaatconversie]]
* [[Spell_checking/nl|Spellingcontrole]]
* [[Spell_checking/nl|Spellingcontrole]]
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
 
*[https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]
* [https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
 
* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]


<span id="Language_Learning"></span>
<span id="Language_Learning"></span>
Line 99: Line 104:


*[https://schrijfassistent.be Schrijfassistent]
*[https://schrijfassistent.be Schrijfassistent]
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
*[https://www.nedbox.be NedBox]: online oefeningen om Nederlands te leren
 
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: online oefeningen om Nederlands te leren
*[https://www.nedbox.be NedBox]: Online oefening om Nederlands te leren
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: werkwoorden en hun combinatiepatronen
 
*[https://orientplus.ucll.be/ Orient+]: een serieus spel om de academische woordenschat uit te breiden
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online oefeningen om Nederlands te leren
*[https://www.taalwinkel.nl/ Taalwinkel]: taaladvies
 
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Werkwoorden en hun combinatiepatronen
 
*[https://orientplus.ucll.be/ Orient+]: Een serious game om academische woordenschat te verbeteren
 
*[https://www.taalwinkel.nl/ Taalwinkel]: Taaladvies


<span id="Automatic_linguistic_annotation"></span>
<span id="Automatic_linguistic_annotation"></span>
===Automatische taalkundige annotatie===
===Automatische taalkundige annotatie===


* [[Basic language processing|Eenvoudigetaalverwerking]]
* [[Basic_language_processing/nl|Eenvoudigetaalverwerking]]
* [[Deep parsing|Diepe syntactische analyse (parsing)]]
 
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]]
 
<!-- ===Informatie-extractie!-->
<!-- ===Informatie-extractie!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
Line 118: Line 131:
===Spraakverwerking===
===Spraakverwerking===


* [[Spoken Language Recognition|Gesprokentaalherkenning]]
* [[Spoken_language_recognition/nl|Gesprokentaalherkenning]]
* [[Speech recognition|Spraakherkenning]]
 
* [[Speech_recognition/nl|Spraakherkenning]]
 
* Spraaksynthese
* Spraaksynthese


<span id="Natural_Language_Processing"></span>
<span id="Natural_Language_Processing_(NLP)"></span>
===Natuurlijketaalverwerking===
===Natuurlijketaalverwerking (NTV)===
 
* [[Language_modeling/nl|Taalmodellering]]
 
* [[Machine_translation/nl|Machinevertaling]]
 
* [[Coreference_resolution/nl|Coreferentieresolutie]]
 
* [[Compound_splitting/nl|Samenstellingen splitsen]]
 
* [[Word_sense_disambiguation/nl|Woordbetekenisdesambiguering]]
 
* [[Text_classification/nl|Tekstclassificatie]]
 
* [[Sentiment_analysis/nl|Sentimentanalyse]]


* [[Language_Modeling/nl|Taalmodellering]]
* [[Machine_Translation/nl|Machinevertaling]]
* [[Coreference_Resolution/nl|Coreferentieresolutie]]
* [[Compound_Splitting/nl|Samenstellingen splitsen]]
* [[Word_Sense_Disambiguation/nl|Woordbetekenisdesambiguering]]
* [[Text_Classification/nl|Tekstclassificatie]]
* [[Sentiment_Analysis/nl|Sentimentanalyse]]
* [[Readability/nl|Leesbaarheid]]
* [[Readability/nl|Leesbaarheid]]
* [[Text_simplification/nl|Tekstvereenvoudiging]]
* [[Text_simplification/nl|Tekstvereenvoudiging]]
* [[Clinical_NLP/nl|Klinische NTV]]
* [[Clinical_NLP/nl|Klinische NTV]]


Line 139: Line 163:
===Zoeken in bronnen===
===Zoeken in bronnen===


* [[Corpus querying|Zoeken in een corpus]]
* [[Corpus_querying/nl|Zoeken in een corpus]]
* [[Treebank querying|Zoeken in een treebank]]
 
* [[Treebank_querying/nl|Zoeken in een treebank]]


<span id="Terminology_extraction"></span>
<span id="Terminology_extraction"></span>
Line 146: Line 171:


* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)


Line 156: Line 182:
===Andere===
===Andere===


* Niet eerder vermelde [[CLARIN projects|CLARIN-projecten]] bij INT
* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen.  
 
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen.
 
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen.  Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen.  Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
 
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.  
 
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.


Line 174: Line 207:
==Andere Diensten==
==Andere Diensten==


* [[Bestpracticedocumenten en -richtlijnen]]
* [[Best_practice_documents_and_guidelines/nl|Bestpracticedocumenten en -richtlijnen]]
* [[Stages]]
 
* [[Consulting]]
* [[Internships/nl|Stages]]
* [[CLARIN]] voor het Nederlands
 
* [[Consulting/nl|Consulting]]
 
* [[CLARIN/nl|CLARIN]] voor het Nederlands


<span id="Questions_and_Answers"></span>
<span id="Questions_and_Answers"></span>
==Vragen en Antwoorden==
==Vragen en Antwoorden==


Op de [[Q&A|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
Op de [[Q&A/nl|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.


Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j
Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j

Latest revision as of 07:53, 16 July 2024

Other languages:

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.

De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren (servicedesk@ivdnt.org) met als onderwerp K-Dutch.

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Linguïstische taalmaterialen: datasets

Corpora

Lexicale resources

N-grams

Applicaties voor het Nederlands

Normalisatie

  • TiCCLops: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar

Nederlands leren

  • NedBox: Online oefening om Nederlands te leren
  • Oefenen.nl: Online oefeningen om Nederlands te leren
  • Orient+: Een serious game om academische woordenschat te verbeteren

Automatische taalkundige annotatie


Spraakverwerking

  • Spraaksynthese

Natuurlijketaalverwerking (NTV)

Zoeken in bronnen

Terminologie-extractie

  • D-Terminer-demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.

Andere

  • OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
  • GATE (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. (Dutch services in GATE Cloud).
  • Speech Repository is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
  • Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
  • YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
  • Audacity is een open source audio recording en editing softwareapplicatie.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Andere Diensten

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j