Translations:L2 learner corpora/12/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==LeCoNTra== LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tekens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onde...")
 
No edit summary
Line 1: Line 1:
==LeCoNTra==
==LeCoNTra==
LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tekens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onderzoeksrichtingen, zoals: vertalingsproces onderzoek, leerdercorpus onderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesdata, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig afgestemd op zowel segment als woordniveau, wat leidt tot een kwalitatief sterke corpus met token-level procesdata.
LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onderzoeksrichtingen, zoals: vertalingsproces onderzoek, leerdercorpus onderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesdata, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig afgestemd op zowel segment als woordniveau, wat leidt tot een kwalitatief sterke corpus met token-level procesdata.

Revision as of 15:15, 14 March 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (L2 learner corpora)
==LeCoNTra==
LeCoNTra is a learner corpus consisting of English-to-Dutch news translations enriched with translation process data. Three students of a Master’s programme in Translation were asked to translate 50 different English journalistic texts of approximately 250 tokens each. Because we also collected translation process data in the form of keystroke logging, our dataset can be used as part of different research strands such as translation process research, learner corpus research, and corpus-based translation studies. Reference translations, without process data, are also included. The data has been manually segmented and tokenized, and manually aligned at both segment and word level, leading to a high-quality corpus with token-level process data.

LeCoNTra

LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onderzoeksrichtingen, zoals: vertalingsproces onderzoek, leerdercorpus onderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesdata, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig afgestemd op zowel segment als woordniveau, wat leidt tot een kwalitatief sterke corpus met token-level procesdata.