Translations:Q&A/49/nl
Is er een versie van het Corpus Gesproken Nederlands met alleen maar tekst?
De downloadbestanden van het Corpus Gesproken Nederlands (CGN) bevatten geen versies met alleen maar tekst. The ort
bestanden bevatten ortografische transcripties en tijdsaanduidingen en de plk
bestanden bevatten gedeelte-van-spraak en lemma informatie. Het volgende perl-script neemt een lijst van plk-bestanden als input en print de tekst. Als u dit script runt vanaf de command-lijn in uw terminal, dan kunt u tekstbestanden creëren.