Translations:Corpus querying/2/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemma + gedeelte van spraak tags in TEI of FoLiA formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; 500.000 token limiet voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpus z...") |
No edit summary |
||
Line 1: | Line 1: | ||
Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met | Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemmata en POS-tags in TEI- of FoLiA-formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; een limiet van 500.000 tokens voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpuszoekmachine. De zoekinterface is dezelfde als die gebruikt wordt voor bijvoorbeeld het [https://chn.ivdnt.org Corpus Hedendaags Nederlands]. |
Latest revision as of 10:10, 28 May 2024
Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemmata en POS-tags in TEI- of FoLiA-formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; een limiet van 500.000 tokens voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpuszoekmachine. De zoekinterface is dezelfde als die gebruikt wordt voor bijvoorbeeld het Corpus Hedendaags Nederlands.