Samenstellingen splitsen
Appearance
Samenstellingssplitser demo
Een samenstellingssplitser splitst samenstellingen in hun samenstellende delen, bijvoorbeeld liefde+s+drank of [post+zegel]+verzamelaar. In deze demo kun je tot 500 tekens Nederlands invoeren. Je kan zowel lopende tekst als losse woorden invoeren (één woord per regel). Als je geïnteresseerd bent in het gebruik van de samenstellingssplitser voor andere doeleinden, neem dan contact op met Lieve.Macken@UGent.be.
- Lieve Macken and Arda Tezcan. 2018. “Dutch Compound Splitting for Bilingual Terminology Extraction.” In Multiword Units in Machine Translation and Translation Technology, ed. Ruslan Mitkov, Johanna Monti, Gloria Corpas Pastor, and Violeta Seretan. Vol. 341. John Benjamins, pp. 148–162.
- Demo
CharSplit - An ngram-based compound splitter
Python module that splits a compound into its body and head. So far German and Dutch are supported.
Wordbuilder
- Vincent Vandeghinste (2002). Lexicon Optimization: Maximizing Lexical Coverage in Speech Recognition through Automated Compounding. Proceedings of the Third International Conference on Language Resources and Evaluation (LREC2002). ELRA. Paris.