Translations:Parallel Monolingual Corpora/25/nl

From Clarin K-Centre
Jump to navigation Jump to search

2 De tweede vertaalde dataset is gemaakt door Theresa Seidl in het kader van Controllable sentence simplification in het Nederlands. Dit is een synthetische dataset die een combinatie is van de eerste 10.000 rijen van de parallelle WikiLarge-dataset, en ASSET-dataset (Abstractive Sentence Simplification Evaluation and Tuning). Door deze twee datasets te combineren, vertaalde Theresa ze naar het Nederlands met behulp van Google Neural Machine Translation.