Translations:Q&A/49/nl

From Clarin K-Centre
Jump to navigation Jump to search

Is er een versie van het Corpus Gesproken Nederlands met alleen maar tekst?

De downloadbestanden van het Corpus Gesproken Nederlands (CGN) bevatten geen versies met alleen maar tekst. De ort bestanden bevatten orthografische transcripties en tijdsaanduidingen en de plk bestanden bevatten gedeelte-van-spraak en lemma informatie. Het volgende perl-script neemt een lijst van plk-bestanden als input en print de tekst. Als u dit script runt vanaf de command-lijn in uw terminal, dan kunt u tekstbestanden creëren.