K-Dutch/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
No edit summary
No edit summary
 
(20 intermediate revisions by 3 users not shown)
Line 3: Line 3:


[[File:K-centre-logo.jpg|frameless|right]]
[[File:K-centre-logo.jpg|frameless|right]]
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare tools en data, etymologie, dialect, ....  
Welkom op [[K-Dutch]], de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...  


K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN Kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B centrum] is en dat verschillende  resources voor het Nederlands host. Over 't algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].
K-Dutch is een [https://www.clarin.eu/content/knowledge-centres CLARIN-kenniscentrum]. Het wordt gehost door het [https://www.ivdnt.org Instituut voor de Nederlandse Taal], dat ook een gecertificeerd [https://www.clarin.eu/content/certified-centres CLARIN-B-centrum] is en dat verschillende  resources voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van [https://www.clarin.eu CLARIN-ERIC] en [https://clarin-be.ivdnt.org CLARIN-BE].


De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in
Line 12: Line 12:
* Langere versie (Engels): [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.
* Langere versie (Engels): [https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Deliverable_D1_10__Language_Report_Dutch_.pdf Steurs, Vandeghinste and Daelemans (2022). Report on Dutch.] Project deliverable. European Language Equality.


Uw bijdrage aan deze pagina's is welkom. Gelieve de INT servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch
Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org] met als onderwerp K-Dutch


==Taalkundige onderwerpen==
==Taalkundige onderwerpen==
Line 19: Line 19:
===[[Grammatica]]===
===[[Grammatica]]===


* [[Grammatica#Fonologie,_morfologie_en_syntaxis:_Taalportaal|Fonologie, morfologie en syntaxis: Taalportaal]]
* [[Grammar#Phonology,_Morphology_and_Syntax:_Taalportaal|Phonology, Morphology and Syntax: Taalportaal]]
* [[Grammatica#Morfosyntaxis|Morfosyntaxis]]
* [[Grammar#Morfosyntaxis|Morfosyntaxis]]
* [[Grammatica#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
* [[Grammar#Syntactische_Atlas_van_de_Nederlandse_Dialecten_(SAND)|Syntactische Atlas van de Nederlandse Dialecten (SAND)]]
* [[Grammatica#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
* [[Grammar#Nederlandse_beschrijvende_grammatica:_e-ANS|Nederlandse beschrijvende grammatica: e-ANS]]
* [[Grammatica#Grambank|Grambank]]
* [[Grammar#Grambank|Grambank]]


<span id="Lexicography"></span>
<span id="Lexicography"></span>
Line 29: Line 29:


* [[Lexicografie#Nederlandse_woordenboeken|Nederlandse woordenboeken]]
* [[Lexicografie#Nederlandse_woordenboeken|Nederlandse woordenboeken]]
* [[Lexicografie#ELEXIS|Het ELEXIS project]]
* [[Lexicografie#ELEXIS|Het ELEXIS-project]]
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography
* [https://ivdnt.org/wp-content/uploads/2021/02/The-Future-of-Academic-Lexicography-A-White-Paper.pdf White paper]: The Future of Academic Lexicography


Line 49: Line 49:
* [[Letterteken N-grams]]
* [[Letterteken N-grams]]


==Hulpmiddelen voor het Nederlands==
==Applicaties voor het Nederlands==
===Normalisatie===
===Normalisatie===
* [[Formaatconversie]]
* [[Formaatconversie]]
* [[Spellingcheck]]
* [[Controleren van spelling]]
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
*[https://dev.clarin.nl/node/1914 TiCCLops]: Text-Induced Corpus Clean-up online processing system: niet langer beschikbaar
*[https://lt3.ugent.be/normalisation-demo/ Normalisatie-Demo]
*[https://lt3.ugent.be/normalisation-demo/ Normalisatie-Demo]
Line 66: Line 66:


===Automatische taalkundige annotatie===
===Automatische taalkundige annotatie===
* [[Standaard taalverwerking]]
* [[Eenvoudige Taalverwerking]]
* [[Uitgebreid ontleden]]
* [[Diepe syntactische analyse (parsing)]]
<!-- ===Informatie extractie!-->
<!-- ===Informatie-extractie!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Het verwerken van historische varianten van het Nederlands!-->
<!--* Tekst mining!-->
<!--* Tekst-mining!-->


===Spraakverwerking===
===Spraakverwerking===
Line 78: Line 78:


===Natuurlijke Taalverwerking===
===Natuurlijke Taalverwerking===
* [[Taal Modellering]]
* [[Taalmodellering]]
* [[Machine vertaling]]
* [[Machinevertaling]]
* [[Coreferentie oplossing]]
* [[Coreferentieresolutie]]
* [[Samenvoegingen scheiden]]
* [[Samenstellingen splitsen]]
* [[Woordbetekenisverheldering]]
* [[Woordbetekenisverheldering]]
* [[Tekst classificatie]]
* [[Tekstclassificatie]]
* [[Sentiment analyse]]
* [[Sentimentanalyse]]
* [[Leesbaarheid]]
* [[Leesbaarheid]]
* [[Klinische NTV]]
* [[Klinische NTV]]


===Bron opvraging===
===Zoeken in bronnen===
* [[Corpus opvraging]]
* [[Zoeken in een Corpus]]
* [[Treebank opvraging]]
* [[Zoeken in een Treebank]]


===Machine vertaling===
===Machinevertaling===
====Vertaalmachines====
====Vertaalmachines====
Openbaar beschikbare vertaalmachines van of naar het Nederlands:
Openbaar beschikbare vertaalmachines van of naar het Nederlands:
*[https://www.deepl.com/translator DeepL]
*[https://www.deepl.com/translator DeepL]
*[https://translate.google.com/ Google Vertalen]
*[https://translate.google.com/ Google Vertalen]
*[https://www.bing.com/translator Bing Microsoft vertaler]
*[https://www.bing.com/translator Bing Microsoftvertaler]
*[https://www.reverso.net/ Reverso]
*[https://www.reverso.net/ Reverso]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation van de Europese Unie]
*[https://webgate.ec.europa.eu/etranslation/public/welcome.html eTranslation van de Europese Unie]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]
*[https://mateo.ivdnt.org/Translate MATEO No Language Left Behind]


====Evaluatie van Machine vertaling====
====Evaluatie van machinevertaling====
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]
*[https://mateo.ivdnt.org/Evaluate MATEO Machine Translation Evaluation Online]


===Terminologie extractie===
===Terminologie-extractie===
* [https://termtreffer.org/ Termtreffer]. Vraag een inlog aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://termtreffer.org/ Termtreffer]. Vraag een login aan via [mailto:terminologie@ivdnt.org terminologie@ivdnt.org].
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminologie extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)
* [https://lt3.ugent.be/dterminer D-Terminer demo]. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)


===Terminologie beheer===
===Terminologiebeheer===
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instituties van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.
* [https://iate.europa.eu/home IATE] (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.


===Anders===
===Anders===
* Niet eerder genoemde [[CLARIN-projecten]] bij het Instituut voor de Nederlandse Taal (INT)
* Niet eerder genoemde [[CLARIN-projecten]] bij het Instituut voor de Nederlandse Taal (INT)
* [https://webservices.cls.ru.nl/ Taal en Spraakhulpmiddelen] van de Radboud Universiteit Nijmegen. bijv. [https://webservices.cls.ru.nl/tscan T-scan], een hulpmiddel voor de analyse van Nederlandse teksten waarmee de complexiteit van de tekst kan worden vastgesteld.
* [https://webservices.cls.ru.nl/ Taal en Spraakapplicaties] van de Radboud Universiteit Nijmegen. bijv. [https://webservices.cls.ru.nl/tscan T-scan], een hulpmiddel voor de analyse van Nederlandse teksten waarmee de complexiteit van de tekst kan worden vastgesteld.
* [https://www.opener-project.eu/ OpeNER] is een taalanalyse-toolchain die (academische) onderzoekers en bedrijven helpt bij het begrijpen van natuurlijketaalanalyse. Het bestaat uit gemakkelijk te installeren, verbeteren en te configureren onderdelen om bijv. de taal van een tekst te detecteren, de polarisatie van teksten vast te stellen (sentiment analyse), te detecteren welke onderwerpen zijn ingesloten in de tekst,... De ondersteunde taalset bestaat momenteelt uit: Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://www.opener-project.eu/ OpeNER] is een taalanalyse-toolchain die (academische) onderzoekers en bedrijven helpt bij het begrijpen van natuurlijketaalanalyse. Het bestaat uit gemakkelijk te installeren, verbeteren en te configureren onderdelen om bijv. de taal van een tekst te detecteren, de tekstpolarisatie vast te stellen (sentimentanalyse), te detecteren welke onderwerpen zijn ingesloten in de tekst,... De ondersteunde taalset bestaat momenteel uit: Engels, Spaans, Italiaans, Duits en Nederlands.
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een verzameling van Java-hulpmiddelen die oorspronkelijk zijn ontwikkeld aan de Universiteit van Sheffield en die worden gebruikt voor meerdere natuurlijketaalverwerkingstaken, waaronder informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Nederlandse diensten in GATE Cloud]).
* [https://gate.ac.uk/ GATE] (General Architecture for Text Engineering) is een verzameling van Java-hulpmiddelen die oorspronkelijk zijn ontwikkeld aan de Universiteit van Sheffield en die worden gebruikt voor meerdere natuurlijketaalverwerkingstaken, waaronder informatie-extractie. ([https://cloud.gate.ac.uk/shopfront#tagged=Dutch Nederlandse diensten in GATE Cloud]).
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learning hulpmiddel. Het bevat video opnames van real-life speeches en op maat gemaakt pedagogisch materiaal, die de vertaler en vertalende studenten een kans bieden om te oefenen met hun vertaal skills en deze te verbeteren.
* [https://speech-repository.webcloud.ec.europa.eu/ Speech Repository] is een online e-learninghulpmiddel. Het bevat video-opnames van real-life speeches en op maat gemaakt pedagogisch materiaal, die de vertaler en vertalende studenten een kans bieden om te oefenen met hun vertaalvaardigheden en deze te verbeteren.
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis applicatie voor het creëren, bewerken en omzetten van op tekst gebaseerde ondertiteling bestanden.  
* [https://subworkshop.sourceforge.net/ Subtitle Workshop] is een gratis applicatie voor het creëren, bewerken en omzetten van op tekst gebaseerde ondertitelingbestanden.  
* [https://youdescribe.org/ YouDescribe] is een gratis internetplatform voor het toevoegen van audio beschrijving aan YouTube-content.
* [https://youdescribe.org/ YouDescribe] is een gratis internetplatform voor het toevoegen van audiobeschrijving aan YouTube-content.
* [https://www.audacityteam.org/ Audacity] is een audio-opname en bewerkingssoftwareapplicatie die open source is.
* [https://www.audacityteam.org/ Audacity] is een audio-opname- en bewerkingssoftwareapplicatie die open source is.


==Helpdesk==
==Helpdesk==
Voor informatie over het Nederlands: als u op deze wiki pagina niet de antwoorden op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.
Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar [mailto://servicedesk@ivdnt.org servicedesk@ivdnt.org ]. Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.


U kunt ons ook om informatie en assistentie vragen voor het gebruik van data en hulpmiddelen.
U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.


==Andere Diensten==
==Andere Diensten==
Line 134: Line 134:


==Vragen en Antwoorden==
==Vragen en Antwoorden==
Op de [[Q&A|Vragen en Antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch antwoorden op uw vragen.
Op de [[Q&A|Vragen- en antwoordenpagina]] houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.

Latest revision as of 11:32, 24 April 2024

Other languages:

Mediawiki:Mainpage

Welkom op K-Dutch, de plek voor iedereen die iets over het Nederlands wil weten: taalkundige eigenschappen, taaladvies, beschikbare applicaties en data, etymologie, dialect,...

K-Dutch is een CLARIN-kenniscentrum. Het wordt gehost door het Instituut voor de Nederlandse Taal, dat ook een gecertificeerd CLARIN-B-centrum is en dat verschillende resources voor het Nederlands host. Over het algemeen zijn deze gratis en vrij beschikbaar voor onderzoeksdoeleinden. K-Dutch is een initiatief van CLARIN-ERIC en CLARIN-BE.

De status van het Nederlands met betrekking tot taaltechnologie wordt beschreven in

Uw bijdrage aan deze pagina's is welkom. Gelieve de INT-servicedesk te contacteren servicedesk@ivdnt.org met als onderwerp K-Dutch

Taalkundige onderwerpen

Grammatica

Lexicografie

Terminologie

Spelling

Taalkundige bronnen: datasets

Corpora

Lexicale bronnen

N-grams

Applicaties voor het Nederlands

Normalisatie

De Nederlandse Taal leren

Automatische taalkundige annotatie

Spraakverwerking

Natuurlijke Taalverwerking

Zoeken in bronnen

Machinevertaling

Vertaalmachines

Openbaar beschikbare vertaalmachines van of naar het Nederlands:

Evaluatie van machinevertaling

Terminologie-extractie

  • Termtreffer. Vraag een login aan via terminologie@ivdnt.org.
  • D-Terminer demo. Terminologie-extractie voor het Nederlands, Engels, Frans en Duits. (Rigouts Terryn, A. (2021). D-TERMINE: Data driven Term Extraction Methodologies Investigated [Doctoral thesis]. Ghent University.)

Terminologiebeheer

  • IATE (Interactive Terminology for Europe) is het terminologiebeheerssysteem van de Europese Unie. Het is het gedeelde beheerssysteem van de instellingen van de Europese Unie en het omvat meer dan 7 miljoen termen in 26 talen, die bij elkaar meer dan 100 domeinen van EU-wetgeving beslaan.

Anders

  • Niet eerder genoemde CLARIN-projecten bij het Instituut voor de Nederlandse Taal (INT)
  • Taal en Spraakapplicaties van de Radboud Universiteit Nijmegen. bijv. T-scan, een hulpmiddel voor de analyse van Nederlandse teksten waarmee de complexiteit van de tekst kan worden vastgesteld.
  • OpeNER is een taalanalyse-toolchain die (academische) onderzoekers en bedrijven helpt bij het begrijpen van natuurlijketaalanalyse. Het bestaat uit gemakkelijk te installeren, verbeteren en te configureren onderdelen om bijv. de taal van een tekst te detecteren, de tekstpolarisatie vast te stellen (sentimentanalyse), te detecteren welke onderwerpen zijn ingesloten in de tekst,... De ondersteunde taalset bestaat momenteel uit: Engels, Spaans, Italiaans, Duits en Nederlands.
  • GATE (General Architecture for Text Engineering) is een verzameling van Java-hulpmiddelen die oorspronkelijk zijn ontwikkeld aan de Universiteit van Sheffield en die worden gebruikt voor meerdere natuurlijketaalverwerkingstaken, waaronder informatie-extractie. (Nederlandse diensten in GATE Cloud).
  • Speech Repository is een online e-learninghulpmiddel. Het bevat video-opnames van real-life speeches en op maat gemaakt pedagogisch materiaal, die de vertaler en vertalende studenten een kans bieden om te oefenen met hun vertaalvaardigheden en deze te verbeteren.
  • Subtitle Workshop is een gratis applicatie voor het creëren, bewerken en omzetten van op tekst gebaseerde ondertitelingbestanden.
  • YouDescribe is een gratis internetplatform voor het toevoegen van audiobeschrijving aan YouTube-content.
  • Audacity is een audio-opname- en bewerkingssoftwareapplicatie die open source is.

Helpdesk

Voor informatie over het Nederlands: als u op deze wikipagina geen antwoord op uw vragen vindt, stuur dan een mail met uw vraag naar servicedesk@ivdnt.org . Uw vragen worden zo spoedig mogelijk doorgestuurd naar de geschikte experts en u zou binnen twee werkdagen een antwoord moeten ontvangen.

U kunt ons ook om informatie en assistentie vragen i.v.m. het gebruik van taalmaterialen en applicaties.

Andere Diensten

Vragen en Antwoorden

Op de Vragen- en antwoordenpagina houden we de vragen bij die we ontvingen. Dit groeit uit tot een opslagplaats van K-Dutch-antwoorden op uw vragen.