Jump to content

K-Dutch/nl: Difference between revisions

From Clarin K-Centre
No edit summary
Created page with "*[https://resoomer.ai/nl/ Resoomer] is een website die automatisch en instant samenvattingen genereert van documenten of tekstfragmenten die gebruikers insturen."
 
(37 intermediate revisions by 3 users not shown)
Line 1: Line 1:
<languages/>
<languages/>
<span style="color:white">Mediawiki:Mainpage</span><br>
<span style="color:white">Mediawiki:Mainpage</span>


[[File:K-centre-logo.jpg|frameless|right]]
[[File:K-centre-logo.jpg|frameless|right]]
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  


K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende taalmaterialen voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].
<span id="About"></span>
==[[About/nl|Over]]==


De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
* Korte versie: [https://doi.org/10.1007/978-3-031-28819-7_12 Steurs, Vandeghinste and Daelemans (2023).] Language Report Dutch. In : Rehm, G., Way, A. (eds) ''European Language Equality''. Cognitive Technologies. Springer, Cham.
* Langere versie: [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.


Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren ([mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]) met als onderwerp K-Dutch.
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren ([mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org]) met als onderwerp K-Dutch.
Line 35: Line 32:
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]
* [[Lexicography/nl#Dutch_dictionaries|Nederlandse woordenboeken]]


* [[Lexicography/nl#Elexis|Het Elexis Project]]
* [[Lexicography/nl#Elexis|Het Elexisproject]]


*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
*[https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
Line 64: Line 61:
<span id="Corpora"></span>
<span id="Corpora"></span>
===[[Corpora/nl|Corpora]]===
===[[Corpora/nl|Corpora]]===
* [[Newspaper_corpora/nl| Krantencorpora]]: corpora die uitsluitend bestaan uit krantenteksten
* [https://kdutch.ivdnt.org/wiki/Parliamentary_corpora/nl Parlementaire corpora]
* [https://kdutch.ivdnt.org/wiki/Computer-mediated_communication_corpora/nl Computerondersteundecommunicatiecorpora]
* [https://kdutch.ivdnt.org/wiki/Corpora_of_academic_texts/nl Corpora van academische teksten]
* [https://kdutch.ivdnt.org/wiki/Historical_corpora/nl Historische corpora]
* [https://kdutch.ivdnt.org/wiki/L2_learner_corpora\nl L2-leerdercorpora]
* [https://kdutch.ivdnt.org/wiki/Manually_annotated_corpora/nl Handmatig geannoteerde corpora]
* [https://kdutch.ivdnt.org/wiki/Multimodal_corpora/nl Multimodale corpora]
* [https://kdutch.ivdnt.org/wiki/Parallel_corpora/nl Parallelle corpora]
* [https://kdutch.ivdnt.org/wiki/Reference_corpora/nl Referentiecorpora]
* [https://kdutch.ivdnt.org/wiki/Social_media_corpora/nl Socialemediacorpora]
* [https://kdutch.ivdnt.org/wiki/Spoken_corpora/nl Gesproken corpora]
* [https://kdutch.ivdnt.org/wiki/Sign_Language_corpora/nl Gebarentaalcorpora]
* [https://kdutch.ivdnt.org/wiki/Propbanks/nl Propbanks]: bevatten semantische rollen
* [https://kdutch.ivdnt.org/wiki/Treebanks/nl Treebanks]
* [https://kdutch.ivdnt.org/wiki/Other_corpora/nl Andere corpora]


<span id="Lexical_resources"></span>
<span id="Lexical_resources"></span>
Line 128: Line 93:
* [[Spell_checking/nl|Spellingcontrole]]
* [[Spell_checking/nl|Spellingcontrole]]


* [https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
* [https://piccl.ivdnt.org/ PICCL]: Het Text-Induced Corpus Clean-up (TICCL) online processing system maakt deel uit van PICCL (Philosophical Integrator of Computational and Corpus Libraries). TICCL voert spellingcorrectie en OCR-nabewerking uit.


* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]
* [https://lt3.ugent.be/normalisation-demo/ Normalisatiedemo]


<span id="Language_Learning"></span>
<span id="Language_Learning_Resources"></span>
===Nederlands leren===
===[[Language_Learning_Resources/nl|Taalleerdersbronnen]] (Nederlands leren)===
 
*[https://schrijfassistent.be Schrijfassistent]
 
*[http://schrijfassistent.standaard.be/ Schrijfassistent] van De Standaard
 
*[https://www.nedbox.be NedBox]: Online oefening om Nederlands te leren
 
*[https://oefenen.nl/programma/soort/taal Oefenen.nl]: Online oefeningen om Nederlands te leren
 
*[http://woordcombinaties.ivdnt.org/ Woordcombinaties]: Werkwoorden en hun combinatiepatronen
 
*[https://orientplus.ucll.be/ Orient+]: Een serious game om academische woordenschat te verbeteren
 
*[https://www.taalwinkel.nl/ Taalwinkel]: Taaladvies


<span id="Automatic_linguistic_annotation"></span>
<span id="Automatic_linguistic_annotation"></span>
Line 154: Line 105:
* [[Basic_language_processing/nl|Eenvoudigetaalverwerking]]
* [[Basic_language_processing/nl|Eenvoudigetaalverwerking]]


<div class="mw-translate-fuzzy">
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]]
* [[Deep_parsing/nl|Diepe syntactische analyse (parsing)]]
 
</div>
<!-- ===Informatie-extractie!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Tekst-mining!-->


<span id="Speech_processing"></span>
<span id="Speech_processing"></span>
Line 167: Line 116:
* [[Speech_recognition/nl|Spraakherkenning]]
* [[Speech_recognition/nl|Spraakherkenning]]


* Spraaksynthese
* [[Speech synthesis/nl|Spraaksynthese]]


<span id="Natural_Language_Processing_(NLP)"></span>
<span id="Natural_Language_Processing_(NLP)"></span>
Line 191: Line 140:


* [[Clinical_NLP/nl|Klinische NTV]]
* [[Clinical_NLP/nl|Klinische NTV]]
* [[Syllabification]]
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).


<span id="Resource_querying"></span>
<span id="Resource_querying"></span>
Line 201: Line 154:
<span id="Terminology_extraction"></span>
<span id="Terminology_extraction"></span>
===Terminologie-extractie===
===Terminologie-extractie===
*[https://termwerk.ivdnt.org/ Termwerk]. Nieuwe online term-extractie en termmanagementsysteem, met CLARIN login.


* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].


* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
* [https://lt3.ugent.be/dterminer D-Terminer-demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoraatsthesis]. Universiteit Gent)


<span id="Terminology_management"></span>
<span id="Terminology_management"></span>
Line 210: Line 165:


* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
=== Woordgebruikmetingen===
* Woordpeiler: Temporele tendensen van woorden in het hedendaags Nederlands. Deze toepassing toont grafieken van de relatieve frequentie van de bevraagde woorden over de tijd, met als startpunt 2000.
*[https://woordpeiler.ivdnt.org/ Website]


<span id="Other"></span>
<span id="Other"></span>
Line 215: Line 175:


* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT
* Niet eerder vermelde [[CLARIN projects/nl|CLARIN-projecten]] bij INT
* [https://webservices.cls.ru.nl/ Language and Speech Tools] bij Radboud Nijmegen.


* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen.  Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://www.opener-project.eu/ OpeNER] voert taalanalyse uit om  (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen.  Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Dutch services in GATE Cloud]).


* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
Line 229: Line 185:


* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.
* [https://www.audacityteam.org/ Audacity] is een open source audio recording en editing softwareapplicatie.
[https://debias-tool.ails.ece.ntua.gr/ De-Bias] detecteert verouderde en potentieel schadelijke taal in beschrijvingen van cultureel erfgoedcollecties.
* [https://ai4culture.crosslang.dev/ui Occam] OCR en HTR tool met spellingcorrectie, ook voor het Nederlands.
* [https://www.conker.ai/ Conker]  ondersteunt docenten bij het bedenken van vragen voor opdrachten of evaluaties. Door de tussenkomst van artificiële intelligentie en op basis van zelf ingevoerde leerinhouden of algemene thema’s genereert deze tool automatisch evaluatievragen en opdrachten. Conker biedt enkele gratis mogelijkheden.
* [https://questionwell.org/ QuestionWell] ondersteunt docenten via artificiële intelligentie door sets van vragen en antwoorden te genereren voor specifieke leerinhouden die ze zelf toevoegden aan de tool. QuestionWell biedt enkele gratis mogelijkheden.
*[https://resoomer.ai/nl/ Resoomer] is een website die automatisch en instant samenvattingen genereert van documenten of tekstfragmenten die gebruikers insturen.


==Helpdesk==
==Helpdesk==

Latest revision as of 16:17, 18 November 2025

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

Over

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren (servicedesk@ivdnt.org) met als onderwerp K-Dutch.

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Linguïstische taalmaterialen: datasets

Corpora

Lexicale resources

N-grams

Applicaties voor het Nederlands

Normalisatie

  • PICCL: Het Text-Induced Corpus Clean-up (TICCL) online processing system maakt deel uit van PICCL (Philosophical Integrator of Computational and Corpus Libraries). TICCL voert spellingcorrectie en OCR-nabewerking uit.

Taalleerdersbronnen (Nederlands leren)

Automatische taalkundige annotatie

Spraakverwerking

Natuurlijketaalverwerking (NTV)

  • GATE (General Architecture for Text Engineering) is een Javasuite van tools oorspronkelijk ontwikkeld door de University of Sheffield en wordt gebruikt voor verschillende NLP-taken, zoals informatie-extractie. (Dutch services in GATE Cloud).

Zoeken in bronnen

Terminologie-extractie

  • Termwerk. Nieuwe online term-extractie en termmanagementsysteem, met CLARIN login.
  • D-Terminer-demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoraatsthesis]. Universiteit Gent)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.

Woordgebruikmetingen

  • Woordpeiler: Temporele tendensen van woorden in het hedendaags Nederlands. Deze toepassing toont grafieken van de relatieve frequentie van de bevraagde woorden over de tijd, met als startpunt 2000.

Andere

  • OpeNER voert taalanalyse uit om (academische) onderzoekers en bedrijven te helpen. Het is eenvoudig om te installeren en componenten aan te passen en te configureren om bijvoorbeeld taaldetectie, sentimentanalyse of topicanalyse te doen. Ondersteunde talen zijn Engels, Spaans, Italiaans, Duits en Nederlands.
  • Speech Repository is een online e-learning tool. De repository bevat video-opnames van echte speeches en op maat gemaakt pedagogisch materiaal om vertaal- en tolkstudenten een kans te geven om te oefenen.
  • Subtitle Workshop is een gratis toepassing voor het creëren en bewerken van tekstgebaseerde ondertitelbestanden.
  • YouDescribe is een gratis platform om audiodescriptie toe te voegen aan YouTubecontent
  • Audacity is een open source audio recording en editing softwareapplicatie.

De-Bias detecteert verouderde en potentieel schadelijke taal in beschrijvingen van cultureel erfgoedcollecties.

  • Occam OCR en HTR tool met spellingcorrectie, ook voor het Nederlands.
  • Conker ondersteunt docenten bij het bedenken van vragen voor opdrachten of evaluaties. Door de tussenkomst van artificiële intelligentie en op basis van zelf ingevoerde leerinhouden of algemene thema’s genereert deze tool automatisch evaluatievragen en opdrachten. Conker biedt enkele gratis mogelijkheden.
  • QuestionWell ondersteunt docenten via artificiële intelligentie door sets van vragen en antwoorden te genereren voor specifieke leerinhouden die ze zelf toevoegden aan de tool. QuestionWell biedt enkele gratis mogelijkheden.
  • Resoomer is een website die automatisch en instant samenvattingen genereert van documenten of tekstfragmenten die gebruikers insturen.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Andere Diensten

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

Merk op dat er ook een heel actieve Discordserver is omtrent NLP voor het Nederlands: https://discord.gg/jn94Ux5j