Translations:L2 learner corpora/12/nl

From Clarin K-Centre
Jump to navigation Jump to search

LeCoNTra

LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.