Translations:L2 learner corpora/12/nl: Difference between revisions
(Created page with "==LeCoNTra== LeCoNTra is een leerdercorpus dat bestaat uit nieuwsvertalingen van het Engels naar het Nederlands, die zijn verrijkt met vertalingsprocesdata. Drie studenten van een Master-programma in Vertaling werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tekens te vertalen. Er werd ook vertalingsprocesdata verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als een onderdeel van verschillende onde...") |
No edit summary |
||
(One intermediate revision by one other user not shown) | |||
Line 1: | Line 1: | ||
==LeCoNTra== | ==LeCoNTra== | ||
LeCoNTra is een leerdercorpus dat bestaat uit | LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau. |
Latest revision as of 08:30, 26 March 2024
LeCoNTra
LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.