Corpora of academic texts/nl: Difference between revisions
(Created page with "Corpora van academische teksten bevatten wetenschappelijke publicaties, zoals onderzoekspapers, essays en abstracts die zijn gepubliceerd in academische tijdschriften, conferentie notulen, scripties geschreven door studenten van bachelor en gediplomeerd niveau en wetenschappelijke monografieën.") |
(Created page with "==SABeD corpus== Het SABeD corpus verzamelingsproject is begonnen op 1 Maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal uit op zijn minst 200 colleges bestaan.") |
||
Line 14: | Line 14: | ||
* [https://corpora.uclouvain.be/catalog/corpus/corpus-nederlands-door-natives-cnn Corpus website] | * [https://corpora.uclouvain.be/catalog/corpus/corpus-nederlands-door-natives-cnn Corpus website] | ||
==SABeD corpus== | ==SABeD corpus== | ||
Het SABeD corpus verzamelingsproject is begonnen op 1 Maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal uit op zijn minst 200 colleges bestaan. | |||
* [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website] | * [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website] | ||
Revision as of 14:50, 13 March 2024
Corpora van academische teksten bevatten wetenschappelijke publicaties, zoals onderzoekspapers, essays en abstracts die zijn gepubliceerd in academische tijdschriften, conferentie notulen, scripties geschreven door studenten van bachelor en gediplomeerd niveau en wetenschappelijke monografieën.
Corpus Ondertitelde UVN-Colleges (COUC)
Dit corpus bevat 57 (2020-07-16) ondertitelde colleges van de Universiteit van Nederland (UVN). Er is ondertiteling toegevoegd aan bestaande video-opnames van colleges van de UVN.
In tegenstelling tot gebruikelijke ondertiteling, is de ondertiteling in dit project een zo goed als 100% letterlijke representatie van hetgeen dat wordt gezegd door de mensen in de opnames. Ze bevatten exacte orthografische transcripties van opeenvolgende woorden en tonen daarmee dus de eigenaardigheden van de gesproken taalmodaliteit, met een gebrek aan de grammaticale coherentie die kenmerkend is voor geschreven teksten.
- 22 MB
- versie 1.0 (2020)
- Download pagina
Corpus Nederlands door Natives (CNN)
Argumentatieve schrijftaken geschreven door tweedejaarsstudenten.
SABeD corpus
Het SABeD corpus verzamelingsproject is begonnen op 1 Maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal uit op zijn minst 200 colleges bestaan.