Translations:Q&A/94/nl

From Clarin K-Centre
Jump to navigation Jump to search

De downloadbestanden van het Corpus Gesproken Nederlands (CGN) bevatten geen versies met alleen maar tekst. De ort bestanden bevatten orthografische transcripties en tijdsaanduidingen en de plk bestanden bevatten POS- en lemma-informatie. Het volgende perl-script neemt een lijst van plk-bestanden als input en print de tekst. Als u dit script runt vanaf de command-lijn in uw terminal, dan kunt u tekstbestanden creëren.