Translations:Historical corpora/19/nl

From Clarin K-Centre
Jump to navigation Jump to search

Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn.(delpher.nl/kranten) De oudste, overgeleverde kranten zijn gepubliceerd in 1618. Voor de Delpher-website heeft de Koninklijke Bibliotheek in Den Haag deze zeventiende-eeuwse kranten gescand. Deze scans zijn gelezen met optische tekenherkenning (OCR). OCR kon echter niet overweg met de oude lettertypen en teksten van deze kranten. Daarom heeft het Meertens Instituut een citizen science project opgezet, onder leiding van Nicoline van der Sijs. Met behulp van een collaboratieve webapplicatie, werden alle kranten getranscribeerd en gecorrigeerd door meer dan 300 vrijwilligers van de Stichting Vrijwilligersnetwerk Nederlandse Taal. Vervolgens werd de metadata gecontroleerd en gecorrigeerd en nieuwe metadata toegevoegd, bijvoorbeeld over genre (advertenties, landelijk nieuws, internationaal nieuws, etc.).