User contributions for Floyd

A user with 1,264 edits. Account created on 5 March 2024.
Jump to navigation Jump to search
Search for contributionsExpandCollapse
⧼contribs-top⧽
⧼contribs-date⧽
(newest | oldest) View ( | ) (20 | 50 | 100 | 250 | 500)

21 March 2024

  • 10:1810:18, 21 March 2024 diff hist +19 N Translations:Sign Language corpora/Page display title/nlCreated page with "Gebarentaal corpora"
  • 10:1310:13, 21 March 2024 diff hist +111 Sign Language corporaMarked this version for translation
  • 10:1310:13, 21 March 2024 diff hist +25 Sign Language corporaNo edit summary
  • 10:1210:12, 21 March 2024 diff hist +14 Spoken corporaNo edit summary
  • 10:1210:12, 21 March 2024 diff hist −107 Spoken corpora/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-poi_documentatie_nl.pdf Documentatie] * [[http://lands.let.ru.nl/projects/AutonomataToo/index.php Project website] * [http://hdl.handle.net/10032/tm-a2-n7 Download pagina]"
  • 10:1110:11, 21 March 2024 diff hist +108 N Translations:Spoken corpora/22/nlCreated page with "*[https://hstrik.ruhosting.nl/bliss/ Project pagina] *[http://hdl.handle.net/10032/tm-a2-v3 Download pagina]"
  • 10:1110:11, 21 March 2024 diff hist +278 N Translations:Spoken corpora/21/nlCreated page with "==BLISS Dialogue Summaries== Deze dataset bestaat uit Nederlandse opnamen van deelnemers die praten met het BLISS-dialoogsysteem over hun alledaagse bezigheden en hun favoriete activiteiten. Het corpus bestaat uit 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden." current
  • 10:0810:08, 21 March 2024 diff hist −114 Spoken corpora/nlCreated page with "Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN)."
  • 10:0710:07, 21 March 2024 diff hist +233 N Translations:Spoken corpora/20/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/chorec_documentatie_en.pdf Paper] * [https://www.esat.kuleuven.be/psi/spraak/projects/SPACE/ Project pagina] * [http://hdl.handle.net/10032/tm-a2-j5 Download pagina]"
  • 10:0710:07, 21 March 2024 diff hist +471 N Translations:Spoken corpora/19/nlCreated page with "==Children's Oral Reading Corpus (CHOREC)== Het CHOREC-corpus bevat opgenomen, getranscribeerde en geannoteerde voorgelezen spraak (42 GB of 130 uur) van 400 Nederlandssprekende basisschoolkinderen met of zonder leesproblemen. Analyses van inter- en intra-annotatorovereenkomst zijn uitgevoerd om de consistentie waarmee leesfouten zijn gedetecteerd te onderzoeken, orthografische en fonetische transcripties zijn gemaakt, en leesfouten en leesstrategieën zijn gelabeld."
  • 10:0310:03, 21 March 2024 diff hist +213 Spoken corpora/nlCreated page with "* [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website]"
  • 10:0010:00, 21 March 2024 diff hist +245 N Translations:Spoken corpora/18/nlCreated page with "* [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-poi_documentatie_nl.pdf Documentatie] * [[http://lands.let.ru.nl/projects/AutonomataToo/index.php Project website] * [http://hdl.handle.net/10032/tm-a2-n7 Download pagina]"
  • 10:0010:00, 21 March 2024 diff hist +518 N Translations:Spoken corpora/17/nlCreated page with "==AUTONOMATA-POI-corpus== Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, wat heeft geresulteerd in 5677 extra geluidsbestanden. Alle uitinge..."
  • 10:0010:00, 21 March 2024 diff hist −48 Spoken corpora/nlCreated page with "== COPAS: Corpus Pathologische en Normale Spraak == Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De nodige annotaties werden voorzien."
  • 09:5909:59, 21 March 2024 diff hist +175 N Translations:Spoken corpora/16/nlCreated page with "* versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/auto-nc_lrec2006_en.pdf Paper] * [http://hdl.handle.net/10032/tm-a2-m2 Download pagina]"
  • 09:5909:59, 21 March 2024 diff hist +233 N Translations:Spoken corpora/15/nlCreated page with "==AUTONOMATA-namencorpus== Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel."
  • 09:5809:58, 21 March 2024 diff hist −115 Spoken corpora/nlCreated page with "==SABeD -- Spoken Academic Belgian Dutch== Het SABeD corpus verzamelingsproject is begonnen op 1 maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal bestaan uit 200 colleges."
  • 09:5709:57, 21 March 2024 diff hist +95 N Translations:Spoken corpora/14/nlCreated page with "* [https://www.arts.kuleuven.be/ling/language-education-society/projects/sabed Project website]"
  • 09:5709:57, 21 March 2024 diff hist +221 N Translations:Spoken corpora/13/nlCreated page with "==SABeD -- Spoken Academic Belgian Dutch== Het SABeD corpus verzamelingsproject is begonnen op 1 maart 2021 en is nog niet beschikbaar. Het corpus van gesproken academisch Belgisch-Nederlands zal bestaan uit 200 colleges."
  • 09:5609:56, 21 March 2024 diff hist +2 Spoken corpora/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist +2 Translations:Spoken corpora/12/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist −61 Spoken corpora/nlNo edit summary
  • 09:5409:54, 21 March 2024 diff hist +562 N Translations:Spoken corpora/12/nlCreated page with "* 115 uur aan gesproken Nederlands * spraak van kinderen, ouderen en anderstaligen en mens-machinedialogen. * letterlijke transcriptie, een transcriptie van de mens-machine-interactiefenomen, POS tagging van de woorden, en een automatische fonetische transcriptie. * versie 1.0 (2008) * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/jasmin_lrec2008_en.pdf Recording Speech of Children, Non-Natives and Elderly People for HLT Applications: the JASMIN-CGN C..."
  • 09:5209:52, 21 March 2024 diff hist +109 Spoken corpora/nlCreated page with "==Corpus Gesproken Nederlands== Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders."
  • 09:5009:50, 21 March 2024 diff hist +209 Translations:Spoken corpora/11/nlNo edit summary current
  • 09:5009:50, 21 March 2024 diff hist −227 Translations:Spoken corpora/11/nlNo edit summary
  • 09:4909:49, 21 March 2024 diff hist +368 N Translations:Spoken corpora/11/nlCreated page with "Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN)."
  • 09:4609:46, 21 March 2024 diff hist −111 Spoken corpora/nlCreated page with "*versie 1.0 (2001) *4.6 MB *[http://hdl.handle.net/10032/tm-a2-n8 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFAcorpus/ Project website]"
  • 09:4409:44, 21 March 2024 diff hist +23 N Translations:Spoken corpora/10/nlCreated page with "==JASMIN-spraakcorpus==" current
  • 09:4409:44, 21 March 2024 diff hist +165 N Translations:Spoken corpora/9/nlCreated page with "*versie 1.0 (2001) *4.6 MB *[http://hdl.handle.net/10032/tm-a2-n8 Download pagina] *[https://www.fon.hum.uva.nl/IFA-SpokenLanguageCorpora/IFAcorpus/ Project website]"
  • 09:4309:43, 21 March 2024 diff hist +429 N Translations:Spoken corpora/8/nlCreated page with "==IFA Spoken Language Corpus== Het IFA Spoken Language Corpus is een gratis (GPL) database van handmatig gesegmenteerde gesproken Nederlands op foneem niveau. Het is samengesteld met pasklare software en gesproken Nederlands afkomstig van 8 sprekers met een verscheidenheid aan spreekstijlen. Voor een totaal van 50.000 woorden (41 minuten/spreker), duurde het vergaren en voorbereiden van spraak ongeveer drie weken per spreker."
  • 09:3709:37, 21 March 2024 diff hist +6,937 N Spoken corpora/nlCreated page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu..."
  • 09:3709:37, 21 March 2024 diff hist +588 N Translations:Spoken corpora/7/nlCreated page with "* 900 uur gesproken Nederlands * 1998 - 2004 * getagged, gelemmatiseerd, geannoteerd (orthografisch/fonetisch) * corpus exploration software (Corex) * versie 2.0.3. * [https://taalmaterialen.ivdnt.org/wp-content/uploads/documentatie/cgn_website/doc_English/start.htm Project website] * [http://hdl.handle.net/10032/tm-a2-k6 Download pagina] * [https://portal.clarin.inl.nl/opensonar_frontend/opensonar/search Online zoeken met OpenSonar]. Ga naar ''Extended Mode'' om uitslu..."
  • 09:3409:34, 21 March 2024 diff hist +254 N Translations:Spoken corpora/6/nlCreated page with "De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica, frequentielijsten en de corpusexploratiesoftware Corex behoren ook tot het CGN." current
  • 09:3309:33, 21 March 2024 diff hist +200 N Translations:Spoken corpora/5/nlCreated page with "==Corpus Gesproken Nederlands== Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders." current
  • 09:3209:32, 21 March 2024 diff hist +153 N Translations:Spoken corpora/4/nlCreated page with "* Belgisch-Nederlands * [http://hdl.handle.net/10032/tm-a2-n3 Download pagina] * [https://www.esat.kuleuven.be/psi/spraak/projects/SPACE/ Project pagina]"
  • 09:3209:32, 21 March 2024 diff hist +464 N Translations:Spoken corpora/3/nlCreated page with "== COPAS: Corpus Pathologische en Normale Spraak == Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De nodige annotaties werden voorzien." current
  • 09:3109:31, 21 March 2024 diff hist +784 N Translations:Spoken corpora/2/nlCreated page with "==Boarnsterhim Corpus (BHC) (Momenteel niet beschikbaar)== Het Boarnsterhim Corpus bestaat uit 250 uur spraak in zowel West-Fries als Nederlands door dezelfde groep tweetalige sprekers. Het corpus bevat originele opnamen uit 1982-1984 en een replicerend onderzoek 35 jaar later. De dataverzameling omvat de spraak van vier generaties en combineert paneldata en trenddata. ''##Dit corpus is tijdelijk niet beschikbaar omdat er aanpassingen noodzakelijk zijn. Voor meer informa..."
  • 09:2809:28, 21 March 2024 diff hist +110 N Translations:Spoken corpora/1/nlCreated page with "Gesproken corpora zijn corpora die bestaan uit gesproken data of materiaal dat gebaseerd is op gesproken data." current
  • 09:2709:27, 21 March 2024 diff hist +17 N Translations:Spoken corpora/Page display title/nlCreated page with "Gesproken corpora" current
  • 09:2709:27, 21 March 2024 diff hist +255 Spoken corporaMarked this version for translation
  • 09:2709:27, 21 March 2024 diff hist +25 Spoken corporaNo edit summary
  • 09:2609:26, 21 March 2024 diff hist +14 Social media corporaNo edit summary
  • 09:2609:26, 21 March 2024 diff hist −21 Social media corpora/nlCreated page with "==TwiSty Author Profiling Corpus== TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteur- profiling. Het bestaat uit personaliteits-(MBTI)-en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, als ook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de..."
  • 09:2509:25, 21 March 2024 diff hist +532 N Translations:Social media corpora/6/nlCreated page with "==TwiSty Author Profiling Corpus== TwiSty is een corpus dat is ontwikkeld voor onderzoek naar auteur- profiling. Het bestaat uit personaliteits-(MBTI)-en genderannotaties voor in totaal 18.168 auteurs in zes talen. Het corpus verspreidt de Twitter-id's van deze auteurs, als ook de id's van hun beschikbare tweets ten tijde van de ontwikkeling van het corpus. De tweets hebben taalidentificatie ondergaan en kunnen worden teruggevonden in een Bevestigd (als behorend bij de..."
  • 09:1809:18, 21 March 2024 diff hist −29 Social media corpora/nlCreated page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd."
  • 09:1509:15, 21 March 2024 diff hist +395 N Translations:Social media corpora/5/nlCreated page with "==Whatsapp corpus Verheijen== Whatsappdata verzameld voor het promotieonderzoek van Lieke Verheijen (Radboud Universiteit). Geïnformeerde toestemming werd alleen verleend door de deelnemer aan het onderzoek en niet door de gesprekspartner. Als een gevolg daarvan bevat het subcorpus enkel bijdragen van de zender. * [https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:112987 Project website]"
  • 09:1109:11, 21 March 2024 diff hist −144 Social media corpora/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]"
  • 09:1109:11, 21 March 2024 diff hist +56 N Translations:Social media corpora/4/nlCreated page with "* [http://hdl.handle.net/10032/tm-a2-k3 Download pagina]"
  • 09:1109:11, 21 March 2024 diff hist +256 N Translations:Social media corpora/3/nlCreated page with "==SoNaR Nieuwe Media Corpus== Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd." current
(newest | oldest) View ( | ) (20 | 50 | 100 | 250 | 500)