Spell checking/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "==PICCL== (Het lijkt erop dat dit niet langer wordt ondersteund)")
No edit summary
Line 3: Line 3:


*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper]
*[https://www.clips.uantwerpen.be/clinjdraft/clinj/article/view/79/71 Paper]
*[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Download pagina]
*[https://liir.cs.kuleuven.be/software_pages/dt_correction_dataset_preprocessing.php Downloadpagina]


==HunSpell==
==HunSpell==
Line 12: Line 12:
(Dit lijkt niet langer te worden ondersteund)
(Dit lijkt niet langer te worden ondersteund)


PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende hulpmiddelen.
PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools.


Het belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up' systeem, dat spellingcorrectie en OCR post-correctie uitvoert (normalisering van spellingvarianten etc.)
Het belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up' systeem, dat spellingcorrectie en OCR post-correctie uitvoert (normalisering van spellingvarianten etc.)


* [https://portal.clarin.inl.nl/piccl/ Online versie]
* [https://portal.clarin.inl.nl/piccl/ Online versie]

Revision as of 13:56, 3 April 2024

Automatische correctie van contextafhankelijke dt-fouten

Een spellingscorrectiesysteem dat automatisch contextafhankelijke dt-fouten detecteert en corrigeert met gebruik van neurale netwerken.

HunSpell

Open source meertalige spellingchecker met woordenboeken, beschikbaar voor het Nederlands

PICCL

(Dit lijkt niet langer te worden ondersteund)

PICCL (Philosophical Integrator of Computational and Corpus Libraries) biedt een workflow voor het bouwen van een corpus en steunt op verschillende tools.

Het belangrijkste component van PICCL is TICCL, een 'Text-induced Corpus Clean-up' systeem, dat spellingcorrectie en OCR post-correctie uitvoert (normalisering van spellingvarianten etc.)