Translations:Manually annotated corpora/13/nl: Difference between revisions
Jump to navigation
Jump to search
(Created page with "==Dutch Archaeology NER Training Dataset== Een handmatig geannoteerde Named Entity Recognition (NER) dataset, bestaand uit Nederlandse archeologische opgravingsverslagen. De volgende entity types zijn gelabeld: Artefacten, Tijdperiodes, Materialen, Plaatsen (geografische locaties), Archeologische contexten en Soorten. The dataset wordt aangeboden in het BIO format, met elk token op 1 lijn en lege lijnen die grenzen van zinnen aanduiden. Op elke lijn staat een token, PoS...") |
No edit summary |
||
Line 1: | Line 1: | ||
==Dutch Archaeology NER Training Dataset== | ==Dutch Archaeology NER Training Dataset== | ||
Een handmatig geannoteerde Named Entity Recognition | Een handmatig geannoteerde NER-dataset (Named Entity Recognition), bestaande uit Nederlandse archeologische opgravingsverslagen. De volgende entiteittypes zijn gelabeld: Artefacten, Tijdperiodes, Materialen, Plaatsen (geografische locaties), Archeologische contexten en Soorten. | ||
De dataset wordt geleverd in het BIO-formaat, met elk token op 1 lijn en lege regels die zinsgrenzen aanduiden. Op elke regel staat een token, een PoS-tag, de morfologische segmentatie en ten slotte het label, gescheiden door spaties. De PoS-tag en morfologische segmentatie zijn toegewezen door Frog. |
Revision as of 09:06, 26 March 2024
Dutch Archaeology NER Training Dataset
Een handmatig geannoteerde NER-dataset (Named Entity Recognition), bestaande uit Nederlandse archeologische opgravingsverslagen. De volgende entiteittypes zijn gelabeld: Artefacten, Tijdperiodes, Materialen, Plaatsen (geografische locaties), Archeologische contexten en Soorten. De dataset wordt geleverd in het BIO-formaat, met elk token op 1 lijn en lege regels die zinsgrenzen aanduiden. Op elke regel staat een token, een PoS-tag, de morfologische segmentatie en ten slotte het label, gescheiden door spaties. De PoS-tag en morfologische segmentatie zijn toegewezen door Frog.