Translations:Parallel Monolingual Corpora/2/nl

From Clarin K-Centre
Revision as of 14:04, 11 June 2024 by Vincent (talk | contribs) (Created page with "Het DAESO Corpus is een parallelle eentalige treebank van Nederlandse teksten. Het corpus bevat ruim 2,1 miljoen woorden parallelle en vergelijkbare tekst. Ongeveer 678.000 woorden werden handmatig uitgelijnd en ongeveer 1,5 miljoen woorden werden automatisch uitgelijnd. Er is een semantische relatie toegevoegd aan de gealigneerde woorden/zinnen.")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Het DAESO Corpus is een parallelle eentalige treebank van Nederlandse teksten. Het corpus bevat ruim 2,1 miljoen woorden parallelle en vergelijkbare tekst. Ongeveer 678.000 woorden werden handmatig uitgelijnd en ongeveer 1,5 miljoen woorden werden automatisch uitgelijnd. Er is een semantische relatie toegevoegd aan de gealigneerde woorden/zinnen.