Jump to content

Translations:Simplification Data/30/nl: Difference between revisions

From Clarin K-Centre
Created page with "De synthetische simplificatiedataset werd gecompileerd in het kader van het Duidelijke Taal-project en is gebaseerd op de WR-P-E-I component (websites) van het SoNaR corpus. De dataset bestaat uit drie delen: 6986 zinnen uit het SoNaR corpus, een synthetische vereenvoudiging van deze zinnen, gemaakt door GPT-4 en een bestand met zinsparen, waarbij SoNaR zin gealigeneerd is met de vereenvoudigde versie."
 
(No difference)

Latest revision as of 10:31, 3 December 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Simplification Data)
The Synthetic Simplification Dataset was compiled within the Duidelijke Taal project and is based on the WR-P-E-I component (websites) of the SoNaR corpus. The dataset consists of three parts: 6,986 sentences from the SoNaR corpus, a synthetic simplification of the SoNaR sentences created by GPT-4 and sentence pairs consisting of one SoNaR sentence and its simplified version each.

De synthetische simplificatiedataset werd gecompileerd in het kader van het Duidelijke Taal-project en is gebaseerd op de WR-P-E-I component (websites) van het SoNaR corpus. De dataset bestaat uit drie delen: 6986 zinnen uit het SoNaR corpus, een synthetische vereenvoudiging van deze zinnen, gemaakt door GPT-4 en een bestand met zinsparen, waarbij SoNaR zin gealigeneerd is met de vereenvoudigde versie.