Translations:Corpus querying/2/nl

From Clarin K-Centre
Revision as of 10:10, 28 May 2024 by Griet (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemmata en POS-tags in TEI- of FoLiA-formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; een limiet van 500.000 tokens voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpuszoekmachine. De zoekinterface is dezelfde als die gebruikt wordt voor bijvoorbeeld het Corpus Hedendaags Nederlands.