Conceptual resources/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "*[http://cornetto.clarin.inl.nl/index.html Online demo] *[http://wordpress.let.vupr.nl/cornetto/ Project website]")
No edit summary
 
(12 intermediate revisions by 4 users not shown)
Line 1: Line 1:
<languages/>
== Open Dutch Wordnet ==
== Open Dutch Wordnet ==
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat.
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat.
*[http://wordpress.let.vupr.nl/odwn/ Project website]
*[http://wordpress.let.vupr.nl/odwn/ Projectwebsite]


==  Cornetto-LMF (Lexicon Markup Framework) ==
==  Cornetto-LMF (Lexicon Markup Framework) ==
Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert.
Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert.
Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Nederlands Referentie Lexicon, dat woorden ordent in vorm-betekenis units (lexicale invoergegevens) en beschrijft met korte definities, gebruiksbeperkingen, selectierestricties, syntactische gedragingen, combinatorische informatie en illustratieve contexten. Cornetto kan worden gezien als de combinatie van een thesaurus en een woordenboek. Het is beschikbaar voor gebruik via een webbrowser en is ook beschikbaar in XML vorm (opensourcewordnet). Cornetto heeft circa 177.000 lexicale invoergegevens en 70.000 synsets.
Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Referentiebestand Nederlands, dat woorden ordent in vorm-betekenisunits (lemmata) en beschrijft met korte definities, gebruiksbeperkingen, selectierestricties, syntactische gedragingen, combinatorische informatie en illustratieve contexten. Cornetto kan worden gezien als de combinatie van een thesaurus en een woordenboek. Het is beschikbaar voor gebruik via een webbrowser en is ook beschikbaar in XML vorm (opensourcewordnet). Cornetto heeft circa 177.000 lemmata en 70.000 synsets.


*[http://cornetto.clarin.inl.nl/index.html Online demo]
*[http://cornetto.clarin.inl.nl/index.html Online demo]
*[http://wordpress.let.vupr.nl/cornetto/ Project website]
*[http://wordpress.let.vupr.nl/cornetto/ Projectwebsite]


== Dutch SemCor ==
== Dutch SemCor ==
Dutch SemCor biedt een corpus, volledig sense-tagged met senses en domain tags uit de Cornetto database
Dutch SemCor biedt een corpus, volledig gelabeld voor betekenis en domein, uit de Cornettodatabase
*[http://wordpress.let.vupr.nl/dutchsemcor/ Project website]
*[http://wordpress.let.vupr.nl/dutchsemcor/ Projectwebsite]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download menselijke annotaties]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download manuele annotaties]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine-annotaties]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine-annotaties]


<div lang="en" dir="ltr" class="mw-content-ltr">
== EuroWordNet Nederlands ==
== EuroWordNet Dutch ==
EuroWordNet is een meertalige database met wordnets voor verscheidene Europese talen (Nederlands, Italiaans, Spaans, Frans, Tsjechisch en Ests). De wordnets zijn op dezelfde wijze gestructureerd als het Amerikaanse wordnet voor het Engels (Princeton WordNet, Miller et al 1990) wat betreft synsets (synoniemensets) met standaard semantische relaties tussen hen. Elk wordnet vertegenwoordigt een uniek taalintrinsiek systeem van lexicalisaties.
EuroWordNet is a multilingual database with wordnets for several European languages (Dutch, Italian, Spanish, German, French, Czech and Estonian). The wordnets are structured in the same way as the American wordnet for English ( Princeton WordNet, Miller et al 1990) in terms of synsets (sets of synonymous words) with basic semantic relations between them. Each wordnet represents a unique language-internal system of lexicalizations.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[http://catalog.elra.info/en-us/repository/browse/ELRA-M0016/ Informatie]
*[http://catalog.elra.info/en-us/repository/browse/ELRA-M0016/ Information]
*[http://catalog.elra.info/en-us/purchase-procedure-info/ Aankoopprocedure]
*[http://catalog.elra.info/en-us/purchase-procedure-info/ Purchase procedure]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
== Open Multilingual WordNet ==
== Open Multilingual WordNet ==
The goal of this project is to make it easy to use wordnets in multiple languages.
Het doel van dit project is om het gemakkelijk te maken om wordnets te gebruiken in meerdere talen.
There are currently two versions of the OMW.
Er zijn momenteel twee versies van het OMW.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://omwn.org/omw1.html OMW Versie 1] verbindt handmatige gecreëerde wordnets en automatisch gecreëerde wordnets voor meer dan 150 talen met behulp van het Princeton Wordnet van het Engels.
* [https://omwn.org/omw1.html OMW Version 1] links hand created wordnets and automatically created wordnets for over a 150 languages through the Princeton Wordnet of English.
* [https://omwn.org/omw2.html OMW Versie 2], de huidige (experimentele) versie, die gebruikmaakt van de Collaborative Interlingual Index om wordnets aan elkaar te verbinden.
* [https://omwn.org/omw2.html OMW Version 2], the current (experimental) version, uses the Collaborative Interlingual Index to link the wordnets together
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
== Woordassociatie Data ==
== Word Association Data ==
Woordassociatie en deelnemersdata voor 100 primaire, secundaire en tertiaire antwoorden op 12.571 cues zoals beschreven in De Deyne, Navarro and Storms (2013).
Word association and participant data for 100 primary, secondary and tertiary responses to 12,571 cues as reported in De Deyne, Navarro and Storms (2013).
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://smallworldofwords.org/en/project/research#download Datadownload]
*[https://smallworldofwords.org/en/project/research#download Data download]
*[https://smallworldofwords.org/articles/2012.DeDeyneNavarroStorms.Wordassociations.BRM.pdf De Deyne, S., Navarro, D., Storms, G. (2013). Better explanations of lexical and semantic cognition using networks derived from continued rather than single word associations. Behavior Research Methods, 45 (2), 480-498.]
*[https://smallworldofwords.org/articles/2012.DeDeyneNavarroStorms.Wordassociations.BRM.pdf De Deyne, S., Navarro, D., Storms, G. (2013). Better explanations of lexical and semantic cognition using networks derived from continued rather than single word associations. Behavior Research Methods, 45 (2), 480-498.]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
== Leeftijd van Verwervingdata ==
== Age of Acquisition Data ==
In navolging van gelijksoortige onderzoeken in het Engels, worden voor 30.000 Nederlandse woorden de ratings van de leeftijd van verwerving gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waarin taalonderzoekers waarschijnlijk geïnteresseerd zijn.
Following similar studies in English, ratings of age of acquisition for 30,000 Dutch words are presented and validated. These include nearly all lemmas language researchers are likely to be interested in.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
*[https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/aoa/appnet.htm Datadownload]
*[https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/aoa/appnet.htm Data download]
*[https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/aoa Website]   
*[http://crr.ugent.be/archives/1602 Website]  (not functional anymore)
*[https://www.researchgate.net/publication/262385555_Norms_of_age_of_acquisition_and_concreteness_for_30000_Dutch_words Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]
*[https://www.researchgate.net/publication/262385555_Norms_of_age_of_acquisition_and_concreteness_for_30000_Dutch_words Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
== Concreteness Data ==
== Concreteness Data ==
Following similar studies in English, ratings of concreteness for 30,000 Dutch words are presented and validated. These include nearly all lemmas language researchers are likely to be interested in.
*[http://crr.ugent.be/papers/Concreteness%20ratings%20Brysbaert%20et%20al.xlsx Concreteness norms] (links are dead)
*[http://crr.ugent.be/archives/1602 Website]
*[http://crr.ugent.be/papers/Norms%20of%20AoA%20and%20Concreteness%20for%2030000%20Dutch%20words%20final.pdf Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
Van der Goten, K., De Vooght, G., & Kemps, E. (1999). Concreteness and emotional valence ratings of 399 Dutch nouns. Psychologica Belgica, 39, 49-70.
== Datasets for Psychological Research ==
 
* [https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/nouns/1.xls 1-lettergreep normen]
* [https://www.ugent.be/pp/experimentele-psychologie/en/research/documents/nouns/3.xls 3-lettergrepen normen]
 
Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]
 
* geen gegevens gevonden
 
== Datasets voor psychologisch onderzoek ==
https://www.ugent.be/pp/experimentele-psychologie/en/research/documents
https://www.ugent.be/pp/experimentele-psychologie/en/research/documents
</div>

Latest revision as of 07:46, 11 October 2024

Other languages:

Open Dutch Wordnet

Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat.

Cornetto-LMF (Lexicon Markup Framework)

Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert. Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Referentiebestand Nederlands, dat woorden ordent in vorm-betekenisunits (lemmata) en beschrijft met korte definities, gebruiksbeperkingen, selectierestricties, syntactische gedragingen, combinatorische informatie en illustratieve contexten. Cornetto kan worden gezien als de combinatie van een thesaurus en een woordenboek. Het is beschikbaar voor gebruik via een webbrowser en is ook beschikbaar in XML vorm (opensourcewordnet). Cornetto heeft circa 177.000 lemmata en 70.000 synsets.

Dutch SemCor

Dutch SemCor biedt een corpus, volledig gelabeld voor betekenis en domein, uit de Cornettodatabase

EuroWordNet Nederlands

EuroWordNet is een meertalige database met wordnets voor verscheidene Europese talen (Nederlands, Italiaans, Spaans, Frans, Tsjechisch en Ests). De wordnets zijn op dezelfde wijze gestructureerd als het Amerikaanse wordnet voor het Engels (Princeton WordNet, Miller et al 1990) wat betreft synsets (synoniemensets) met standaard semantische relaties tussen hen. Elk wordnet vertegenwoordigt een uniek taalintrinsiek systeem van lexicalisaties.

Open Multilingual WordNet

Het doel van dit project is om het gemakkelijk te maken om wordnets te gebruiken in meerdere talen. Er zijn momenteel twee versies van het OMW.

  • OMW Versie 1 verbindt handmatige gecreëerde wordnets en automatisch gecreëerde wordnets voor meer dan 150 talen met behulp van het Princeton Wordnet van het Engels.
  • OMW Versie 2, de huidige (experimentele) versie, die gebruikmaakt van de Collaborative Interlingual Index om wordnets aan elkaar te verbinden.

Woordassociatie Data

Woordassociatie en deelnemersdata voor 100 primaire, secundaire en tertiaire antwoorden op 12.571 cues zoals beschreven in De Deyne, Navarro and Storms (2013).

Leeftijd van Verwervingdata

In navolging van gelijksoortige onderzoeken in het Engels, worden voor 30.000 Nederlandse woorden de ratings van de leeftijd van verwerving gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waarin taalonderzoekers waarschijnlijk geïnteresseerd zijn.

Concreteness Data

Van der Goten, K., De Vooght, G., & Kemps, E. (1999). Concreteness and emotional valence ratings of 399 Dutch nouns. Psychologica Belgica, 39, 49-70.

Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84]

  • geen gegevens gevonden

Datasets voor psychologisch onderzoek

https://www.ugent.be/pp/experimentele-psychologie/en/research/documents