Translations:Corpus querying/2/nl: Difference between revisions

Latest revision as of 10:10, 28 May 2024

Information about message (contribute)

This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.

Message definition (Corpus querying)

Users can upload text data annotated with lemma + part of speech tags in TEI or FoLiA format, either as a single XML file or as an archive (zip or tar.gz) containing several XML files. Corpus size is limited to begin with (25 MB limit per uploaded file; 500,000 token limit for an entire corpus), but these limits may be increased at a later point in time. The search application is powered by the INL BlackLab corpus search engine. The search interface is the same as the one used in for example the [https://chn.ivdnt.org Corpus of Contemporary Dutch / Corpus Hedendaags Nederlands].

Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemmata en POS-tags in TEI- of FoLiA-formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; een limiet van 500.000 tokens voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpuszoekmachine. De zoekinterface is dezelfde als die gebruikt wordt voor bijvoorbeeld het Corpus Hedendaags Nederlands.

Revision as of 08:57, 4 April 2024 view source Floyd (talk \| contribs) auteur, Bureaucrats, Interface administrators, Suppressors, Administrators 1,264 edits Created page with "Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemma + gedeelte van spraak tags in TEI of FoLiA formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; 500.000 token limiet voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpus z..."		Latest revision as of 10:10, 28 May 2024 view source Griet (talk \| contribs) auteur, Bureaucrats, Interface administrators, Suppressors, Administrators 1,381 edits No edit summary
Line 1:		Line 1:
	Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met ~~lemma + gedeelte van spraak~~ tags in TEI of FoLiA formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; 500.000 ~~token limiet~~ voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-~~corpus zoekmachine~~. De ~~zoek-interface~~ is dezelfde als die gebruikt wordt voor bijvoorbeeld het [https://chn.ivdnt.org Corpus Hedendaags Nederlands].		Gebruikers kunnen tekstdata uploaden die geannoteerd zijn met lemmata en POS-tags in TEI- of FoLiA-formaat. Dit kan in een los XML-bestand, of als een archief (zip of tar.gz) dat meerdere bestanden bevat. Om te beginnen is de corpusgrootte gelimiteerd (25 MB limiet per geüpload bestand; een limiet van 500.000 tokens voor een geheel corpus), maar deze limieten kunnen worden verhoogd op een later moment. De zoekapplicatie wordt aangedreven door de INL BlackLab-corpuszoekmachine. De zoekinterface is dezelfde als die gebruikt wordt voor bijvoorbeeld het [https://chn.ivdnt.org Corpus Hedendaags Nederlands].