Main public logs
Appearance
Combined display of all available logs of Clarin K-Centre. You can narrow down the view by selecting a log type, the username (case-sensitive), or the affected page (also case-sensitive).
- 09:49, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/11/nl (Created page with "Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).")
- 09:44, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/10/nl (Created page with "==JASMIN-spraakcorpus==")
- 09:44, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/9/nl (Created page with "*versie 1.0 (2001) *4.6 MB *[http://hdl.handle.net/10032/tm-a2-n8 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFAcorpus/ Project website]")
- 09:43, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/8/nl (Created page with "==IFA Spoken Language Corpus== Het IFA Spoken Language Corpus is een gratis (GPL) database van handmatig gesegmenteerde gesproken Nederlands op foneem niveau. Het is samengesteld met pasklare software en gesproken Nederlands afkomstig van 8 sprekers met een verscheidenheid aan spreekstijlen. Voor een totaal van 50.000 woorden (41 minuten/spreker), duurde het vergaren en voorbereiden van spraak ongeveer drie weken per spreker.")
- 09:37, 21 March 2024 Floyd talk contribs created page Spoken corpora/nl (Created page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu...")
- 09:37, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/7/nl (Created page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu...")
- 09:34, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/6/nl (Created page with "De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica, frequentielijsten en de corpusexploratiesoftware Corex behoren ook tot het CGN.")
- 09:33, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/5/nl (Created page with "==Corpus Gesproken Nederlands== Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders.")
- 09:32, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/4/nl (Created page with "* Belgisch-Nederlands * [http://hdl.handle.net/10032/tm-a2-n3 Download pagina] * [https://www.esat.kuleuven.be/psi/spraak/projects/SPACE/ Project pagina]")
- 09:32, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/3/nl (Created page with "== COPAS: Corpus Pathologische en Normale Spraak == Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De nodige annotaties werden voorzien.")
- 09:31, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/2/nl (Created page with "==Boarnsterhim Corpus (BHC) (Momenteel niet beschikbaar)== Het Boarnsterhim Corpus bestaat uit 250 uur spraak in zowel West-Fries als Nederlands door dezelfde groep tweetalige sprekers. Het corpus bevat originele opnamen uit 1982-1984 en een replicerend onderzoek 35 jaar later. De dataverzameling omvat de spraak van vier generaties en combineert paneldata en trenddata. ''##Dit corpus is tijdelijk niet beschikbaar omdat er aanpassingen noodzakelijk zijn. Voor meer informa...")
- 09:28, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/1/nl (Created page with "Gesproken corpora zijn corpora die bestaan uit gesproken data of materiaal dat gebaseerd is op gesproken data.")
- 09:27, 21 March 2024 Floyd talk contribs created page Translations:Spoken corpora/Page display title/nl (Created page with "Gesproken corpora")
- 09:27, 21 March 2024 Floyd talk contribs marked Spoken corpora for translation
- 09:25, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/6/nl (Created page with "==TwiSty Author Profiling Corpus== TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteur- profiling. Het bestaat uit personaliteits-(MBTI)-en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, als ook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de...")
- 09:15, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/5/nl (Created page with "==Whatsapp corpus Verheijen== Whatsappdata verzameld voor het promotieonderzoek van Lieke Verheijen (Radboud Universiteit). Geïnformeerde toestemming werd alleen verleend door de deelnemer aan het onderzoek en niet door de gesprekspartner. Als een gevolg daarvan bevat het subcorpus enkel bijdragen van de zender. * [https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:112987 Project website]")
- 09:11, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/4/nl (Created page with "* [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]")
- 09:11, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/3/nl (Created page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd.")
- 09:08, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/2/nl (Created page with "* [https://github.com/tommasoc80/DALC Github] * [https://dataverse.nl/dataset.xhtml?persistentId=doi%3A10.34894%2FHOINL3 Website] * Publicatie: '''Caselli, Tommaso, Schelhaas, Arjan, Weultjes, Marieke, Leistra, Folkert, van der Veen, Hylke, Timmerman, Gerben and Nissim, Malvina''' (2021). [https://aclanthology.org/2021.woah-1.6/ DALC: the Dutch Abusive Language Corpus.] Handelingen van de 5e Workshop van Online Abuse and Harms (WOAH). Association for Computational Lingui...")
- 09:06, 21 March 2024 Floyd talk contribs created page Translations:Social media corpora/1/nl (Created page with "==DALC Dutch Abusive Language Corpus== The Dutch Abusive Language Corpus v1.0 (DALC v1.0)")
- 10:08, 20 March 2024 Floyd talk contribs created page Social media corpora/nl (Created page with "Sociale media corpora")
- 10:08, 20 March 2024 Floyd talk contribs created page Translations:Social media corpora/Page display title/nl (Created page with "Sociale media corpora")
- 10:07, 20 March 2024 Floyd talk contribs marked Social media corpora for translation
- 16:04, 19 March 2024 Floyd talk contribs created page Reference corpora/nl (Created page with "== Lassy Groot == Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.")
- 16:03, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/11/nl (Created page with "*[http://opensonar.clarin.inl.nl/ Online zoeken] *[http://hdl.handle.net/10032/tm-a2-h5 Download pagina] *[http://lands.let.ru.nl/projects/SoNaR/ Project pagina]")
- 16:03, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/10/nl (Created page with "De nieuwemediateksten (tweets, chats en sms'en), die ook verzameld werden in het kader van het STEVIN-project SoNaR maken geen deel uit van het SoNaR-corpus 1.0. en zijn apart als het SoNaR Nieuwe Media Corpus beschikbaar.")
- 16:02, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/9/nl (Created page with "SoNaR-1 is grotendeels een subset van SoNaR-500 en bevat 1 miljoen woorden. SoNaR-1 werd voorzien van verschillende soorten semantische annotaties, nl. named entity labelling, coreferentieannotatie en de annotatie van spatiële en temporele relaties. Alle annotaties van SoNaR-1 werden manueel geverifieerd.")
- 16:02, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/8/nl (Created page with "SoNaR-500 bevat meer dan 500 miljoen woorden tekst afkomstig uit uiteenlopende domeinen en genres. Alle teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. Ook de named entities werden gelabeld. Alle annotaties van SoNaR-500 werden automatisch geproduceerd.")
- 16:02, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/7/nl (Created page with "== SoNaR corpus== Het SoNaR-corpus is een tekstcorpus dat bestaat uit twee delen, nl. SoNaR-500 en SoNaR-1.")
- 16:01, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/6/nl (Created page with "*[http://hdl.handle.net/10032/tm-a2-w8 Download] *[https://paqu.let.rug.nl:8068/ Online treebank search] with PaQu *[http://chn.gretel.ivdnt.org/ Online treebank search] with Federated GrETEL")
- 16:01, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/5/nl (Created page with "== Lassy Groot == Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.")
- 16:00, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/4/nl (Created page with "*[http://chn.ivdnt.org/ Online zoeken]")
- 16:00, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/3/nl (Created page with "Het juridische corpus met data van 1814-2000 dat oorspronkelijk onderdeel was van het 38 miljoenwoordencorpora is uit het corpus weggelaten. Dit corpus is beschikbaar gemaakt als los onderdeel via [https://corpusjuridischnederlands.ivdnt.org/ corpus].")
- 15:57, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/2/nl (Created page with "Het CHN bevat al het beschikbare moderne Nederlandse tekstmateriaal waarvan het INT het recht heeft verworven om de data online te zetten. Het corpus omvat materiaal uit Nederlands, Vlaanderen, Suriname en de Nederlandse Antillen. De voorganger van het INT, het Instituut voor Nederlandse Lexicologie (INL), heeft sinds 1994 verschillende corpora van hedendaags Nederlands online gezet: de 5, 27 en 38 miljoenwoordencorpora en het Dutch PAROLE Internet Corpus. Het materiaal...")
- 15:53, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/1/nl (Created page with "== Corpus Hedendaags Nederlands == Het Corpus Hedendaags Nederlands (CHN) is een groeiende tekstverzameling van meer dan 2.500.000 teksten uit kranten, tijdschriften, journaaluitzendingen, blogs, websites en romans.")
- 15:52, 19 March 2024 Floyd talk contribs created page Translations:Reference corpora/Page display title/nl (Created page with "Referentie corpora")
- 15:52, 19 March 2024 Floyd talk contribs marked Reference corpora for translation
- 15:50, 19 March 2024 Floyd talk contribs created page Translations:Parallel corpora/4/nl (Created page with "*Parallelle Eentalige Corpora")
- 15:50, 19 March 2024 Floyd talk contribs created page Translations:Parallel corpora/3/nl (Created page with "*Parallelle Meertalige Corpora")
- 15:49, 19 March 2024 Floyd talk contribs created page Translations:Parallel corpora/2/nl (Created page with "Eentalige parallelle corpora bestaan ook en bevatten onder meer zinnen en hun parafrases of zinnen en hun gesimplificeerde vorm.")
- 15:45, 19 March 2024 Floyd talk contribs created page Translations:Parallel corpora/1/nl (Created page with "Parallelle corpora zijn van onmiskenbaar belang voor vertaalstudies en contrastieve taalkunde. Veel van de parallelle corpora zijn toegankelijk doormiddel van gemakkelijk te gebruiken concordanties die het onderzoek naar interlinguïstische fenomenen mogelijk maken. Zulke corpora zijn ook een rijke bron van materialen voor het leren van een taal. Daarnaast dienen parallelle corpora als trainingdata voor machinevertalingssystemen.")
- 15:33, 19 March 2024 Floyd talk contribs created page Parallel corpora/nl (Created page with "Parallelle corpora")
- 15:33, 19 March 2024 Floyd talk contribs created page Translations:Parallel corpora/Page display title/nl (Created page with "Parallelle corpora")
- 15:33, 19 March 2024 Floyd talk contribs marked Parallel corpora for translation
- 15:30, 19 March 2024 Floyd talk contribs created page Translations:Multimodal corpora/3/nl (Created page with "*versie 1.0 (2007) *90.74 MB *[http://hdl.handle.net/10032/tm-a2-g5 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFADVcorpus/ Project website]")
- 15:30, 19 March 2024 Floyd talk contribs created page Translations:Multimodal corpora/2/nl (Created page with "==IFA Dialog Video corpus== Dit corpus bestaat uit video- en geluidsopnamen van spontane dialogen tussen proefpersonen. Het bevat 24 video-opnames van spontane dialogen, waarvan er 20 zijn geannoteerd. 42 proefpersonen (14 mannelijk, 28 vrouwelijk) participeerden in dit onderzoek")
- 15:28, 19 March 2024 Floyd talk contribs created page Translations:Multimodal corpora/1/nl (Created page with "Multimodale corpora zijn datacollecties die worden gebruikt om te onderzoeken hoe twee of meer modaliteiten gedurende menselijke communicatie raakvlakken vertonen met elkaar.")
- 15:23, 19 March 2024 Floyd talk contribs created page Multimodal corpora/nl (Created page with "Multimodale corpora")
- 15:16, 19 March 2024 Floyd talk contribs created page Translations:Multimodal corpora/Page display title/nl (Created page with "Multimodale corpora")
- 15:15, 19 March 2024 Floyd talk contribs marked Multimodal corpora for translation