Parallel Monolingual Corpora/nl: Revision history

Jump to navigation Jump to search

Diff selection: Mark the radio buttons of the revisions to compare and hit enter or the button at the bottom.
Legend: (cur) = difference with latest revision, (prev) = difference with preceding revision, m = minor edit.

2 July 2024

11 June 2024

  • curprev 15:2215:22, 11 June 2024Griet talk contribs 4,900 bytes +7 Created page with "* 3.02 MB * [https://huggingface.co/datasets/UWV/veringewikkelderingen Downloadpagina]"
  • curprev 15:1515:15, 11 June 2024Griet talk contribs 4,893 bytes −163 Created page with "* 8.67 MB * [https://huggingface.co/datasets/NetherlandsForensicInstitute/simplewiki-translated-nl Download dataset]"
  • curprev 15:1215:12, 11 June 2024Griet talk contribs 5,056 bytes −202 Created page with "* 17.5 MB"
  • curprev 15:0215:02, 11 June 2024Griet talk contribs 5,258 bytes −138 Created page with "2) De tweede dataset is gemaakt door UWV Nederland als onderdeel van het “Leesplank”-project, een poging om datasets te genereren die ethisch en juridisch verantwoord zijn. De dataset bestaat uit 2,87 miljoen alinea's en de bijbehorende vereenvoudigde tekst. De paragrafen zijn gebaseerd op het Nederlandse Wikipedia-extract uit [http://gigacorpus.nl/ Gigacorpus]. De tekst is gefilterd en opgeschoond door [https://learn.microsoft.com/en-us/azure/ai-services/openai/conc..."
  • curprev 14:5514:55, 11 June 2024Griet talk contribs 5,396 bytes −119 Created page with "* [https://huggingface.co/datasets/BramVanroy/chatgpt-dutch-simplification Downloadpagina (CSV-bestanden)]"
  • curprev 14:5214:52, 11 June 2024Griet talk contribs 5,515 bytes −34 Created page with "Het Nederlandse gemeentelijke corpus is een parallel monolinguaal corpus voor de evaluatie van zinsvereenvoudiging in het Nederlandse gemeentelijke domein. Het corpus is gemaakt door Amsterdam Intelligence. Het bevat 1.311 vertaalde parallelle zinsparen die automatisch gealigneerd werden. De zinsparen zijn afkomstig uit 50 documenten van de communicatieafdeling van de gemeente Amsterdam die handmatig werden vereenvoudigd om de vereenvoudiging voor het Nederlands te evalu..."
  • curprev 14:4814:48, 11 June 2024Griet talk contribs 5,549 bytes −81 Created page with "* 265 KB * [https://github.com/Amsterdam-AI-Team/dutch-municipal-text-simplification/tree/master/complex-simple-sentences Download dataset (CSV-bestand)]"
  • curprev 14:4314:43, 11 June 2024Griet talk contribs 5,630 bytes −53 Created page with "'''Manueel gecreëerde datasets'''"
  • curprev 14:4114:41, 11 June 2024Griet talk contribs 5,683 bytes +9 No edit summary
  • curprev 14:3914:39, 11 June 2024Griet talk contribs 5,674 bytes +32 No edit summary
  • curprev 14:1214:12, 11 June 2024Vincent talk contribs 5,642 bytes +5,642 Created page with "Parallelle Eentalige Corpora"