Spell checking/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper] *[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Download pagina]") |
No edit summary |
||
(2 intermediate revisions by 2 users not shown) | |||
Line 3: | Line 3: | ||
*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper] | *[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper] | ||
*[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php | *[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Downloadpagina] | ||
==HunSpell== | ==HunSpell== | ||
Line 12: | Line 12: | ||
(Dit lijkt niet langer te worden ondersteund) | (Dit lijkt niet langer te worden ondersteund) | ||
PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende | PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools. | ||
De belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up'-systeem, dat spellingcorrectie en OCR-postcorrectie uitvoert (normalisering van spellingvarianten etc.) | |||
* [https://portal.clarin.inl.nl/piccl/ Online versie] | |||
* [https://portal.clarin.inl.nl/piccl/ Online | |||
Latest revision as of 18:04, 4 June 2024
Automatische correctie van contextafhankelijke dt-fouten
Een spellingscorrectiesysteem dat automatisch contextafhankelijke dt-fouten detecteert en corrigeert met gebruik van neurale netwerken.
HunSpell
Open source meertalige spellingchecker met woordenboeken, beschikbaar voor het Nederlands
PICCL
(Dit lijkt niet langer te worden ondersteund)
PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools.
De belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up'-systeem, dat spellingcorrectie en OCR-postcorrectie uitvoert (normalisering van spellingvarianten etc.)