Uit het SONAR-500-corpus versie 1.2 zijn n-grammen van lettertekenreeksen met lengtes 1, 2 en 3 afgeleid.