Translations:L2 learner corpora/12/nl
LeCoNTra
LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onderzoeksrichtingen, zoals: vertalingsproces onderzoek, leerdercorpus onderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesdata, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig afgestemd op zowel segment als woordniveau, wat leidt tot een kwalitatief sterke corpus met token-level procesdata.