Taalmodellering

This page is a translated version of the page Language Modeling and the translation is 100% complete.

N-gram-modellering

'Colibri core' is een natuurlijketaalverwerkingstool alsook een C++- en Python-bibliotheek voor het werken met standaard taalkundige constructies zoals n-grams en skipgrams (d.w.z. patronen met een of meerdere gaten van ofwel vaststaande, ofwel dynamische grootte) op een snelle en geheugenefficiënte manier. In de kern bevindt zich de colibri-patroonmodelleerder die het mogelijk maakt om querypatternmodellen te bouwen, bekijken en bewerken.

Githubpagina

Grote Taalmodellen

Hugging Face Dutch Models
RobBERT: Een Nederlands RoBERTa-taalmodel
BERTje: Een Nederlands BERT-model
GEITje: Een groot open taalmodel

Meertalige Taalmodellen inclusief het Nederlands

GPT-3
MBart

SpaCy

spaCy is een gratis opensourcebibliotheek voor natuurlijketaalverwerking in Python.

Nederlandse modellen