We zullen wat onderwerpsmodelleringsanalyses toepassen op wat Vlaams/Belgisch-Nederlandse data die we hebben. Omdat onze dataset relatief klein is voor deze soort taak, is het idee om het onderwerpmodel te trainen op een veel groter corpus (bijv. social media posts). Weet u of zo een corpus wellicht beschikbaar is?