Translations:Parallel Monolingual Corpora/23/nl

From Clarin K-Centre
Jump to navigation Jump to search

1 De eerste vertaalde dataset is gemaakt door het Nederlands Forensisch Instituut met behulp van Meta's No Language Left Behind-model. De dataset bestaat uit 167.000 uitgelijnde zinsparen en dient als Nederlandse vertaling van de SimpleWiki-dataset