Jump to content

Translations:Parallel Multilingual Corpora/10/nl

From Clarin K-Centre
Revision as of 13:21, 11 June 2024 by Griet (talk | contribs) (Created page with "Het corpus bevat vijf verschillende tekstsoorten en is gebalanceerd wat betreft tekstsoort en vertaalrichting. Het hele corpus is uitgelijnd op zinsniveau en verder verrijkt met linguïstische informatie (lemma's en POS-tags). Een kleine subset van het Nederlands-Engelse deel is ook handmatig uitgelijnd op zinsdeelniveau.")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Het corpus bevat vijf verschillende tekstsoorten en is gebalanceerd wat betreft tekstsoort en vertaalrichting. Het hele corpus is uitgelijnd op zinsniveau en verder verrijkt met linguïstische informatie (lemma's en POS-tags). Een kleine subset van het Nederlands-Engelse deel is ook handmatig uitgelijnd op zinsdeelniveau.