Translations:Other corpora/14/nl

From Clarin K-Centre
Jump to navigation Jump to search

DBRD

De DBRD (uitgesproken als 'dee-bird') dataset bevat meer dan 110.000 boekreviews, waarvan 22.000 met bijbehorende binaire sentimentpolariteitslabels. De dataset is bedoeld als een benchmark voor sentimentclassificatie in het Nederlands. De dataset kan worden gebruikt om een model te trainen voor sequentiemodellering, in het specifiek taalmodellering en daarnaast kan de data worden gebruikt om een model te trainen voor tekstclassificatie, in het bijzonder sentimentclassificatie, met gebruik van de aangeboden positieve/negatieve sentimentpolariteitslabels.