Jump to content

Compound splitting/nl: Difference between revisions

From Clarin K-Centre
FuzzyBot (talk | contribs)
Updating to match new version of source page
Created page with "==CharSplit - An ngram-based compound splitter== Pythonmodule die een samenstelling opsplitst in het hoofd en de rest van de samenstelling. Op dit moment worden enkel Duits en Nederlands ondersteund."
Line 7: Line 7:
*[https://lt3.ugent.be/compound-splitter-demo/ Demo]
*[https://lt3.ugent.be/compound-splitter-demo/ Demo]


<div lang="en" dir="ltr" class="mw-content-ltr">
==CharSplit - An ngram-based compound splitter==
==CharSplit - An ngram-based compound splitter==
Python module that splits a compound into its body and head. So far German and Dutch are supported.
Pythonmodule die een samenstelling opsplitst in het hoofd en de rest van de samenstelling. Op dit moment worden enkel Duits en Nederlands ondersteund.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">

Revision as of 17:28, 3 April 2025

Samenstellingssplitser demo

Een samenstellingssplitser splitst samenstellingen in hun samenstellende delen, bijvoorbeeld liefde+s+drank of [post+zegel]+verzamelaar. In deze demo kun je tot 500 tekens Nederlands invoeren. Je kan zowel lopende tekst als losse woorden invoeren (één woord per regel). Als je geïnteresseerd bent in het gebruik van de samenstellingssplitser voor andere doeleinden, neem dan contact op met Lieve.Macken@UGent.be.

CharSplit - An ngram-based compound splitter

Pythonmodule die een samenstelling opsplitst in het hoofd en de rest van de samenstelling. Op dit moment worden enkel Duits en Nederlands ondersteund.

Wordbuilder