K-Dutch/nl: Difference between revisions
(Created page with "===Bron opvraging=== * Corpus opvraging * Treebank opvraging") |
(Updating to match new version of source page) |
||
(126 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
<languages/> | |||
<span style="color:white">Mediawiki:Mainpage</span><br> | <span style="color:white">Mediawiki:Mainpage</span><br> | ||
[[File:K-centre-logo.jpg|frameless|right]] | [[File:K-centre-logo.jpg|frameless|right]] | ||
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare | Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,... | ||
K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN | K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE]. | ||
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in | De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in | ||
* Korte versie | * Korte versie: [https://doi.org/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham. | ||
* Langere versie | * Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality. | ||
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch | Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren ([mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]) met als onderwerp K-Dutch. | ||
<span id="Linguistic_topics"></span> | |||
==Taalkundige onderwerpen== | ==Taalkundige onderwerpen== | ||
<span id="Grammar"></span> | <span id="Grammar"></span> | ||
===[[Grammatica]]=== | ===[[Grammar/nl|Grammatica]]=== | ||
* [[ | * [[Grammar/nl#Phonology,_morphology_and_syntax:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]] | ||
* [[ | |||
* [[ | * [[Grammar/nl#Morfosyntaxis|Morfosyntaxis]] | ||
* [[ | |||
* [[ | * [[Grammar/nl#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]] | ||
* [[Grammar/nl#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]] | |||
* [[Grammar/nl#Grambank|Grambank]] | |||
<span id="Lexicography"></span> | <span id="Lexicography"></span> | ||
===[[Lexicografie]]=== | ===[[Lexicography/nl|Lexicografie]]=== | ||
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]] | |||
* [[Lexicography/nl#Elexis|Het Elexisproject]] | |||
*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography | |||
<span id="Terminology"></span> | |||
===[[Terminology/nl|Terminologie]]=== | |||
*[[Terminology/nl#Expertisecentrum_Nederlandstalige_Terminologie|Het Expertisecentrum Nederlandstalige Terminologie]] | |||
*[[Terminology/nl#Academische_taal|Academische taal]] | |||
*[[Terminology/nl#Medische_terminologie|Medische terminologie]] | |||
*[[Terminology/nl#Nederlands_als_wetenschapstaal|Nederlands als wetenschapstaal]] | |||
*[[Terminology/nl#Juridische_terminologie|Juridische terminologie]] | |||
<span id="Spelling"></span> | |||
===[[Spelling/nl|Spelling]]=== | |||
*[[Spelling/nl#Woordenlijst.org_(Officiёle_Nederlandse_woorden_Lijst)|Woordenlijst.org (Officiёle Nederlandse woordenlijst)]] | |||
*[[Spelling/nl#Spelling_Certification_Mark|Keurmerk Spelling]] | |||
<span id="Linguistic_resources:_datasets"></span> | |||
==Linguïstische taalmaterialen: datasets== | |||
<span id="Corpora"></span> | |||
===[[Corpora/nl|Corpora]]=== | |||
<span id="Lexical_resources"></span> | |||
===Lexicale resources=== | |||
* [[Lexica/nl|Lexica]] | |||
*[[ | |||
* [[Dictionaries|Woordenboeken]] | |||
*[[ | |||
*[[ | * [[Conceptual_resources/nl|Conceptuele resources]] | ||
* [[Wordlists/nl|Woordenlijsten]] | |||
* [[Embeddings/nl|Embeddings]] | |||
* [[Lexica_of_terminology/nl|Terminologielexica]] | |||
* [[Ontologies/nl|Ontologieën]] | |||
===N-grams=== | ===N-grams=== | ||
== | * [[Character_N-grams/nl|Letterteken-N-grams]] | ||
<span id="Tools_for_Dutch"></span> | |||
==Applicaties voor het Nederlands== | |||
<span id="Normalisation"></span> | |||
===Normalisatie=== | ===Normalisatie=== | ||
=== | * [[Format_conversion/nl|Formaatconversie]] | ||
* [[Spell_checking/nl|Spellingcontrole]] | |||
* [https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar | |||
* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo] | |||
<span id="Language_Learning"></span> | |||
===Nederlands leren=== | |||
*[https://schrijfassistent.be Schrijfassistent] | *[https://schrijfassistent.be Schrijfassistent] | ||
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard | *[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard | ||
*[https://www.nedbox.be NedBox]: Online oefening om Nederlands te leren | |||
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online oefeningen om Nederlands te leren | |||
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Werkwoorden en hun combinatiepatronen | |||
*[https://orientplus.ucll.be/ Orient+]: Een serious game om academische woordenschat te verbeteren | |||
*[https://www.taalwinkel.nl/ Taalwinkel]: Taaladvies | |||
<span id="Automatic_linguistic_annotation"></span> | |||
===Automatische taalkundige annotatie=== | ===Automatische taalkundige annotatie=== | ||
* [[ | |||
* [[ | * [[Basic_language_processing/nl|Eenvoudigetaalverwerking]] | ||
<!-- ===Informatie extractie!--> | |||
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]] | |||
<!-- ===Informatie-extractie!--> | |||
<!--* Het verwerken van historische varianten van het Nederlands!--> | <!--* Het verwerken van historische varianten van het Nederlands!--> | ||
<!--* Tekst mining!--> | <!--* Tekst-mining!--> | ||
<span id="Speech_processing"></span> | |||
===Spraakverwerking=== | ===Spraakverwerking=== | ||
* [[Spoken_language_recognition/nl|Gesprokentaalherkenning]] | |||
* [[ | |||
* [[ | * [[Speech_recognition/nl|Spraakherkenning]] | ||
* | |||
* Spraaksynthese | |||
* [[ | |||
<span id="Natural_Language_Processing_(NLP)"></span> | |||
* [[ | ===Natuurlijketaalverwerking (NTV)=== | ||
* [[ | * [[Language_modeling/nl|Taalmodellering]] | ||
* [[Machine_translation/nl|Machinevertaling]] | |||
* [[Coreference_resolution/nl|Coreferentieresolutie]] | |||
* [[Compound_splitting/nl|Samenstellingen splitsen]] | |||
* [[ | |||
* [[Word_sense_disambiguation/nl|Woordbetekenisdesambiguering]] | |||
*[ | |||
* [[Text_classification/nl|Tekstclassificatie]] | |||
*[ | |||
* [[Sentiment_analysis/nl|Sentimentanalyse]] | |||
* [ | |||
* [[Readability/nl|Leesbaarheid]] | |||
* [ | |||
< | * [[Text_simplification/nl|Tekstvereenvoudiging]] | ||
===Other=== | |||
* | * [[Clinical_NLP/nl|Klinische NTV]] | ||
* [https://webservices.cls.ru.nl/ Language and Speech Tools] | |||
* [https://www.opener-project.eu/ OpeNER] | <span id="Resource_querying"></span> | ||
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is | ===Zoeken in bronnen=== | ||
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is | |||
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is | * [[Corpus_querying/nl|Zoeken in een corpus]] | ||
* [https://youdescribe.org/ YouDescribe] is | |||
* [https://www.audacityteam.org/ Audacity] is | * [[Treebank_querying/nl|Zoeken in een treebank]] | ||
<span id="Terminology_extraction"></span> | |||
===Terminologie-extractie=== | |||
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org]. | |||
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.) | |||
<span id="Terminology_management"></span> | |||
===Terminologiebeheer=== | |||
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan. | |||
<span id="Other"></span> | |||
===Andere=== | |||
* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT | |||
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen. | |||
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands. | |||
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]). | |||
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen. | |||
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden. | |||
* [https://youdescribe.org/ YouDescribe] is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent | |||
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie. | |||
==Helpdesk== | ==Helpdesk== | ||
< | Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen. | ||
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties. | |||
<span id="Other_Services"></span> | |||
==Andere Diensten== | |||
* [[Best_practice_documents_and_guidelines/nl|Bestpracticedocumenten en -richtlijnen]] | |||
* [[Internships/nl|Stages]] | |||
* [[Consulting/nl|Consulting]] | |||
* [[CLARIN/nl|CLARIN]] voor het Nederlands | |||
* [[CLARIN]] | |||
<span id="Questions_and_Answers"></span> | |||
==Vragen en Antwoorden== | ==Vragen en Antwoorden== | ||
Op de [[Q&A|Vragen en | |||
Op de [[Q&A/nl|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen. | |||
Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j |
Latest revision as of 07:53, 16 July 2024
Mediawiki:Mainpage
Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...
K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
- Korte versie: Steurs, Vandeghinste and Daelemans (2023). Language Report Dutch. In : Rehm, G., Way, A. (eds) European Language Equality. Cognitive Technologies. Springer, Cham.
- Langere versie: Steurs, Vandeghinste and Daelemans (2022). Report on Dutch. Project deliverable. European Language Equality.
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren (servicedesk@ivdnt.org) met als onderwerp K-Dutch.
Taalkundige onderwerpen
Grammatica
Lexicografie
- White paper: The Future of Academic Lexicography
Terminologie
Spelling
Linguïstische taalmaterialen: datasets
Corpora
Lexicale resources
N-grams
Applicaties voor het Nederlands
Normalisatie
- TiCCLops: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
Nederlands leren
- Schrijfassistent van De Standaard
- NedBox: Online oefening om Nederlands te leren
- Oefenen.nl: Online oefeningen om Nederlands te leren
- Woordcombinaties: Werkwoorden en hun combinatiepatronen
- Orient+: Een serious game om academische woordenschat te verbeteren
- Taalwinkel: Taaladvies
Automatische taalkundige annotatie
Spraakverwerking
- Spraaksynthese
Natuurlijketaalverwerking (NTV)
Zoeken in bronnen
Terminologie-extractie
- Termtreffer. Vraag een login aan via terminologie@ivdnt.org.
- D-Terminer-demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
Terminologiebeheer
- IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
Andere
- Niet eerder vermelde CLARIN-projecten bij INT
- Language and Speech Tools bij Radboud Nijmegen.
- OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
- GATE (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. (Dutch services in GATE Cloud).
- Speech Repository is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
- Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
- YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
- Audacity is een open source audio recording en editing softwareapplicatie.
Helpdesk
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.
Andere Diensten
- CLARIN voor het Nederlands
Vragen en Antwoorden
Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.
Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j