Conceptuele bronnen
Open Dutch Wordnet
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat.
Cornetto-LMF (Lexicon Markup Framework)
Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert. Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Nederlands Referentie Lexicon, dat woorden ordent in vorm-betekenis units (lexicale invoergegevens) en beschrijft met korte definities, gebruiksbeperkingen, selectierestricties, syntactische gedragingen, combinatorische informatie en illustratieve contexten. Cornetto kan worden gezien als de combinatie van een thesaurus en een woordenboek. Het is beschikbaar voor gebruik via een webbrowser en is ook beschikbaar in XML vorm (opensourcewordnet). Cornetto heeft circa 177.000 lexicale invoergegevens en 70.000 synsets.
Dutch SemCor
Dutch SemCor biedt een corpus, volledig gelabeld voor betekenis en domein, uit de Cornetto database
EuroWordNet Nederlands
EuroWordNet is een meertalige databese met wordnets voor verscheidene Europese talen (Nederlands, Italiaans, Spaans, Frans, Tsjechisch en Ests). De wordnets zijn op dezelfde wijze gestructureerd als het Amerikaanse wordnet voor het Engels (Princeton WordNet, Miller et al 1990) wat betreft synsets (synoniemensets) met standaard semantische relaties tussen hen. Elk wordnet vertegenwoordigt een uniek taal-intrinsiek systeem van lexicalisaties.
Open Multilingual WordNet
Het doel van dit project is om het gemakkelijk te maken om wordnets te gebruiken in meerdere talen. Er zijn momenteel twee versies van het OMW.
- OMW Version 1 verbindt handmatige gecreëerde wordnets en automatisch gecreëerde wordnets voor meer dan 150 talen met behulp van het Princeton Wordnet van het Engels.
- OMW Version 2, de huidige (experimentele) versie, die gebruikmaakt van de Collaborative Interlingual Index om wordnets aan elkaar te verbinden.
Woordassociatie Data
Woordassociatie en deelnemersdata voor 100 primaire, secundaire en tertiaire antwoorden op 12.571 cues zoals beschreven in De Deyne, Navarro and Storms (2013).
- Data download
- De Deyne, S., Navarro, D., Storms, G. (2013). Better explanations of lexical and semantic cognition using networks derived from continued rather than single word associations. Behavior Research Methods, 45 (2), 480-498.
Leeftijd van Verwerving Data
In navolging van gelijksoortige onderzoeken in het Engels, worden voor 30.000 Nederlandse woorden de ratings van de leeftijd van verwerving gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waar taalonderzoekers waarschijnlijk in geïnteresseerd zijn.
- Data download
- Website (functioneert niet meer)
- Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84
Concreteness Data
In navolging van gelijksoortige onderzoeken in het Engels, woorden voor 30.000 Nederlandse woorden de ratings van 'concreteness' gepresenteerd en gevalideerd. Deze bevatten bijna alle lemma's waar taalonderzoekers waarschijnlijk in geïnteresseerd zijn.
- Concreteness norms (links werken niet meer)
- Website
- Brysbaert, M., Stevens, M., De Deyne, S., Voorspoels, W., & Storms, G. (2014). Norms of age of acquisition and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80-84
Datasets voor psychologisch onderzoek
https://www.ugent.be/pp/experimentele-psychologie/en/research/documents