Translations:Other corpora/6/nl
Jump to navigation
Jump to search
Het CSI-corpus is een jaarlijks uitgebreid corpus van studententeksten in twee genres: essays en reviews. Het doel van dit corpus is vooral stylometrisch onderzoek, maar andere toepassingen zijn ook mogelijk. Er is een grote hoeveelheid metadata beschikbaar, zowel over de auteur (gender, leeftijd, seksuele oriëntatie, regio van herkomst, persoonlijkheidsprofiel), als ook over het document (tijdsvermelding, genre, waarheidsgetrouwheid, sentiment, cijfer). De huidige versie van het corpus is samengesteld in februari 2016. Eerdere versies van het corpus zijn per e-mail op te vragen bij de auteurs.