Translations:Parallel Multilingual Corpora/46/nl
De multiLing-dataset is gebaseerd op zes Engelse bronteksten die in verschillende talen zijn vertaald. Vier daarvan (teksten 1-4) zijn nieuwsartikelen en de andere twee (teksten 5-6) zijn sociologische teksten uit een encyclopedie. De Nederlandse data bestaat uit twee delen. ENDU20: tien Nederlandse vertalingen van de multiLing-set door tien vertalers die recent hun mastersdiploma gehaald hebben en die Nederlands als moedertaal hebben. En ENDU20-MT: twee Nederlandse machinevertalingen van de multiLing-set door DeepL (P20) en Google Translate (P21).