Translations:Social media corpora/6/nl
Jump to navigation
Jump to search
TwiSty Author Profiling Corpus
TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteursprofilering. Het bevat persoonlijkheids- en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, alsook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de taal waarin de auteur zich bevindt) en Andere categorie.