Translations:L2 learner corpora/12/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==LeCoNTra== LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tekens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onde...")
 
No edit summary
 
(One intermediate revision by one other user not shown)
Line 1: Line 1:
==LeCoNTra==
==LeCoNTra==
LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tekens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onderzoeksrichtingen, zoals: vertalingsproces onderzoek, leerdercorpus onderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesdata, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig afgestemd op zowel segment als woordniveau, wat leidt tot een kwalitatief sterke corpus met token-level procesdata.
LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.

Latest revision as of 08:30, 26 March 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (L2 learner corpora)
==LeCoNTra==
LeCoNTra is a learner corpus consisting of English-to-Dutch news translations enriched with translation process data. Three students of a Master’s programme in Translation were asked to translate 50 different English journalistic texts of approximately 250 tokens each. Because we also collected translation process data in the form of keystroke logging, our dataset can be used as part of different research strands such as translation process research, learner corpus research, and corpus-based translation studies. Reference translations, without process data, are also included. The data has been manually segmented and tokenized, and manually aligned at both segment and word level, leading to a high-quality corpus with token-level process data.

LeCoNTra

LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.