Jump to content

Translations:Parallel Multilingual Corpora/10/nl: Difference between revisions

From Clarin K-Centre
Created page with "Het corpus bevat vijf verschillende tekstsoorten en is gebalanceerd wat betreft tekstsoort en vertaalrichting. Het hele corpus is uitgelijnd op zinsniveau en verder verrijkt met linguïstische informatie (lemma's en POS-tags). Een kleine subset van het Nederlands-Engelse deel is ook handmatig uitgelijnd op zinsdeelniveau."
 
(No difference)

Latest revision as of 13:21, 11 June 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Parallel Multilingual Corpora)
The corpus contains five different text types and is balanced with respect to text type and translation direction. The entire corpus has been aligned at sentence level and further enriched with linguistic information (lemmas and PoS-tags). A small subset of the Dutch-English part has also been manually aligned at the sub-sentential level.

Het corpus bevat vijf verschillende tekstsoorten en is gebalanceerd wat betreft tekstsoort en vertaalrichting. Het hele corpus is uitgelijnd op zinsniveau en verder verrijkt met linguïstische informatie (lemma's en POS-tags). Een kleine subset van het Nederlands-Engelse deel is ook handmatig uitgelijnd op zinsdeelniveau.