Conceptual Resources/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "== Open Dutch Wordnet == Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. *[http://wordpress.let.vupr.nl/odwn/ Project website]")
(Created page with "*[http://cornetto.clarin.inl.nl/index.html Online demo] *[http://wordpress.let.vupr.nl/cornetto/ Project website]")
Line 10: Line 10:
*[http://wordpress.let.vupr.nl/cornetto/ Project website]
*[http://wordpress.let.vupr.nl/cornetto/ Project website]


<div lang="en" dir="ltr" class="mw-content-ltr">
== Dutch SemCor ==
== Dutch SemCor ==
Dutch SemCor provides a corpus, fully sense-tagged with senses and domain tags from the Cornetto database
Dutch SemCor biedt een corpus, volledig sense-tagged met senses en domain tags uit de Cornetto database
*[http://wordpress.let.vupr.nl/dutchsemcor/ Project website]
*[http://wordpress.let.vupr.nl/dutchsemcor/ Project website]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download human annotations]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/human/ Download menselijke annotaties]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine annotations]
*[http://wordpress.let.vupr.nl/dutchsemcor/results/annotated-data/machine_sonar/ Download machine-annotaties]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">

Revision as of 10:38, 26 March 2024

Open Dutch Wordnet

Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat.

Cornetto-LMF (Lexicon Markup Framework)

Cornetto is een lexicale bron voor de Nederlandse taal, die twee bronnen met verschillende semantische structuren combineert. Het bevat de Dutch Wordnet, dat woorden in synoniemensets (synsets) ordent en de semantische relaties hiertussen vastlegt. Daarnaast bevat het het Nederlands Referentie Lexicon, dat woorden ordent in vorm-betekenis units (lexicale invoergegevens) en beschrijft met korte definities, gebruiksbeperkingen, selectierestricties, syntactische gedragingen, combinatorische informatie en illustratieve contexten. Cornetto kan worden gezien als de combinatie van een thesaurus en een woordenboek. Het is beschikbaar voor gebruik via een webbrowser en is ook beschikbaar in XML vorm (opensourcewordnet). Cornetto heeft circa 177.000 lexicale invoergegevens en 70.000 synsets.

Dutch SemCor

Dutch SemCor biedt een corpus, volledig sense-tagged met senses en domain tags uit de Cornetto database

EuroWordNet Dutch

EuroWordNet is a multilingual database with wordnets for several European languages (Dutch, Italian, Spanish, German, French, Czech and Estonian). The wordnets are structured in the same way as the American wordnet for English ( Princeton WordNet, Miller et al 1990) in terms of synsets (sets of synonymous words) with basic semantic relations between them. Each wordnet represents a unique language-internal system of lexicalizations.

Open Multilingual WordNet

The goal of this project is to make it easy to use wordnets in multiple languages. There are currently two versions of the OMW.

  • OMW Version 1 links hand created wordnets and automatically created wordnets for over a 150 languages through the Princeton Wordnet of English.
  • OMW Version 2, the current (experimental) version, uses the Collaborative Interlingual Index to link the wordnets together

Word Association Data

Word association and participant data for 100 primary, secondary and tertiary responses to 12,571 cues as reported in De Deyne, Navarro and Storms (2013).

Age of Acquisition Data

Following similar studies in English, ratings of age of acquisition for 30,000 Dutch words are presented and validated. These include nearly all lemmas language researchers are likely to be interested in.

Concreteness Data

Following similar studies in English, ratings of concreteness for 30,000 Dutch words are presented and validated. These include nearly all lemmas language researchers are likely to be interested in.