Translations:Simplification Data/36/nl

Als deel van haar stage heeft Eliza Hobo een eerste contextueel lexicaal simplificatiemodel voor het Nederlands ontwikkeld. Door het gebrek aan Nederlandsse evaluatiedata voor lexical simplificatie werd een pilot benchmark dataset voor deze taka notwikkeld, gebruik makend van gemeentelijke data. Er werden zinnen geselecteerd uit een collectie van 48 documenten, gebaseerd op de aanwezigheid van complex woorden uit een lijst gecureerd door domeinexperten en op de zinslengte (minder dan 20 woorden).