Spell checking/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==PICCL== (Het lijkt erop dat dit niet langer wordt ondersteund)")
No edit summary
 
(One intermediate revision by the same user not shown)
Line 3: Line 3:


*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper]
*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper]
*[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Download pagina]
*[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Downloadpagina]


==HunSpell==
==HunSpell==
Line 12: Line 12:
(Dit lijkt niet langer te worden ondersteund)
(Dit lijkt niet langer te worden ondersteund)


PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende hulpmiddelen.
PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools.


Het belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up' systeem, dat spellingcorrectie en OCR post-correctie uitvoert (normalisering van spellingvarianten etc.)
De belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up'-systeem, dat spellingcorrectie en OCR-postcorrectie uitvoert (normalisering van spellingvarianten etc.)


* [https://portal.clarin.inl.nl/piccl/ Online versie]
* [https://portal.clarin.inl.nl/piccl/ Online versie]

Latest revision as of 18:04, 4 June 2024

Automatische correctie van contextafhankelijke dt-fouten

Een spellingscorrectiesysteem dat automatisch contextafhankelijke dt-fouten detecteert en corrigeert met gebruik van neurale netwerken.

HunSpell

Open source meertalige spellingchecker met woordenboeken, beschikbaar voor het Nederlands

PICCL

(Dit lijkt niet langer te worden ondersteund)

PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools.

De belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up'-systeem, dat spellingcorrectie en OCR-postcorrectie uitvoert (normalisering van spellingvarianten etc.)