Translations:Parallel Monolingual Corpora/17/nl
Een uitgebreidere versie van deze dataset is gemaakt door Michiel Buisman en Bram Vanroy. Deze dataset bevat een eerste, kleine set variaties van Wikipediaparagrafen in verschillende stijlen (jargon, officieel, archaïsche taal, technisch, academisch en poëtisch).