Translations:L2 learner corpora/12/nl: Difference between revisions

Latest revision as of 08:30, 26 March 2024

Information about message (contribute)

This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.

Message definition (L2 learner corpora)

==LeCoNTra==
LeCoNTra is a learner corpus consisting of English-to-Dutch news translations enriched with translation process data. Three students of a Master’s programme in Translation were asked to translate 50 different English journalistic texts of approximately 250 tokens each. Because we also collected translation process data in the form of keystroke logging, our dataset can be used as part of different research strands such as translation process research, learner corpus research, and corpus-based translation studies. Reference translations, without process data, are also included. The data has been manually segmented and tokenized, and manually aligned at both segment and word level, leading to a high-quality corpus with token-level process data.

LeCoNTra

LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.

Revision as of 15:15, 14 March 2024 (view source) Floyd (talk \| contribs) No edit summary ← Older edit		Latest revision as of 08:30, 26 March 2024 (view source) Griet (talk \| contribs) No edit summary
Line 1:		Line 1:
	==LeCoNTra==		==LeCoNTra==
	LeCoNTra is een leerdercorpus dat bestaat uit ~~nieuwsvertalingen~~ van het Engels naar het Nederlands, die zijn verrijkt met ~~vertalingsprocesdata~~. Drie studenten van een ~~Master-programma in Vertaling~~ werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er ~~werd~~ ook ~~vertalingsprocesdata~~ verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als ~~een~~ onderdeel van verschillende ~~onderzoeksrichtingen~~, zoals~~: vertalingsproces onderzoek~~, ~~leerdercorpus onderzoek~~ en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder ~~procesdata~~, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig ~~afgestemd~~ op zowel segment als woordniveau, wat leidt tot een ~~kwalitatief sterke~~ corpus met ~~token-level procesdata~~.		LeCoNTra is een leerdercorpus dat bestaat uit vertalingen van nieuwsberichten van het Engels naar het Nederlands, die zijn verrijkt met gegevens over het vertaalproces. Drie studenten van een Masteropleiding Vertalen werd gevraagd om 50 verschillende Engelse journalistieke teksten van ongeveer 250 tokens te vertalen. Er werden ook vertalingsprocesgegevens verzameld in de vorm van toetsaanslagregistratie, waardoor de dataset kan worden gebruikt als onderdeel van verschillende onderzoekslijnenn, zoals vertaalprocesonderzoek, leerdercorpusonderzoek en corpusgerichte vertaalonderzoeken. Referentievertalingen, zonder procesgegevens, zijn ook inbegrepen. De data is handmatig gesegmenteerd en getokeniseerd en handmatig uitgelijnd op zowel segment- als woordniveau, wat leidt tot een corpus van hoge kwaliteit met procesgegevens op tokenniveau.

Translations:L2 learner corpora/12/nl: Difference between revisions

Latest revision as of 08:30, 26 March 2024

LeCoNTra

Navigation menu

Search