Jump to content

Translations:Simplification Data/36/nl: Difference between revisions

From Clarin K-Centre
Created page with "Als deel van haar stage heeft Eliza Hobo een eerste contextueel lexicaal simplificatiemodel voor het Nederlands ontwikkeld. Door het gebrek aan Nederlandsse evaluatiedata voor lexical simplificatie werd een pilot benchmark dataset voor deze taka notwikkeld, gebruik makend van gemeentelijke data. Er werden zinnen geselecteerd uit een collectie van 48 documenten, gebaseerd op de aanwezigheid van complex woorden uit een lijst gecureerd door domeinexperten en op de zinslengt..."
 
(No difference)

Latest revision as of 12:37, 11 August 2025

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Simplification Data)
As part of her internship with us last year, Eliza Hobo developed the first contextual lexical simplification model for Dutch. Due to the lack of Dutch evaluation data for lexical simplification, we developed a pilot benchmark dataset for the task using authentic municipal data. We select sentences from a collection of 48 municipal documents based on the presence of a complex word from a list curated by domain experts and based on their word count (less than 20 words).

Als deel van haar stage heeft Eliza Hobo een eerste contextueel lexicaal simplificatiemodel voor het Nederlands ontwikkeld. Door het gebrek aan Nederlandsse evaluatiedata voor lexical simplificatie werd een pilot benchmark dataset voor deze taka notwikkeld, gebruik makend van gemeentelijke data. Er werden zinnen geselecteerd uit een collectie van 48 documenten, gebaseerd op de aanwezigheid van complex woorden uit een lijst gecureerd door domeinexperten en op de zinslengte (minder dan 20 woorden).