User contributions for Vincent
Jump to navigation
Jump to search
5 July 2024
- 14:2914:29, 5 July 2024 diff hist +30 Translations:Q&A/79/nl No edit summary current
- 14:2814:28, 5 July 2024 diff hist +8 Q&A/nl Created page with "Er zijn een aantal dialoogonderdelen in het CGN (Corpus Gesproken Nederlands). * a. Spontane conversaties ('face-to-face') * c. Telefoondialogen opgenomen m.b.v. platform * d. Telefoondialogen opgenomen m.b.v. minidiskrecorder * e. Zakelijke onderhandelingen"
- 14:2714:27, 5 July 2024 diff hist 0 Translations:Q&A/79/nl No edit summary
- 14:2714:27, 5 July 2024 diff hist −2 Translations:Q&A/79/nl No edit summary
- 14:2714:27, 5 July 2024 diff hist +10 Translations:Q&A/79/nl No edit summary
- 14:2714:27, 5 July 2024 diff hist +3 Q&A/nl Created page with "Zie de Eenvoudige_Taalverwerking pagina."
- 14:2714:27, 5 July 2024 diff hist +3 Translations:Q&A/79/nl No edit summary
- 14:2514:25, 5 July 2024 diff hist +3 Q&A/nl Created page with "Er is een hulpmiddel genaamd [https://tscan.hum.uu.nl/tscan/ T-scan] dat wellicht nuttig is daarvoor."
- 14:2514:25, 5 July 2024 diff hist +3 Translations:Q&A/68/nl No edit summary current
- 14:2414:24, 5 July 2024 diff hist −510 Q&A/nl Created page with "De formule voor Flesch-Douma vereist twee dingen die geteld moeten worden: het aantal woorden in een zin en het aantal lettergrepen per woord. Terwijl het aantal woorden in een zin gemakkelijk te tellen is met elke scripttaal, lijkt het aantal lettergrepen moeilijker te tellen. Het [http://hdl.handle.net/10032/tm-a2-h2 e-Lex]-lexicon bevat woordafbrekingstekens en daarmee het aantal lettergrepen per woord. Een alternatief is om het aantal klinkerclusters in elk woord te..."
- 14:2414:24, 5 July 2024 diff hist +448 N Translations:Q&A/94/nl Created page with "De downloadbestanden van het Corpus Gesproken Nederlands (CGN) bevatten geen versies met alleen maar tekst. De <code>ort</code> bestanden bevatten orthografische transcripties en tijdsaanduidingen en de <code>plk</code> bestanden bevatten POS- en lemma-informatie. Het volgende perl-script neemt een lijst van plk-bestanden als input en print de tekst. Als u dit script runt vanaf de command-lijn in uw terminal, dan kunt u tekstbestanden creëren." current
- 14:2414:24, 5 July 2024 diff hist −449 Translations:Q&A/49/nl No edit summary current
- 14:2414:24, 5 July 2024 diff hist −4,183 Q&A/nl Created page with "We hebben de Treebanks pagina toegevoegd aan deze wiki om antwoord te geven op deze vraag."
- 14:2314:23, 5 July 2024 diff hist +127 N Translations:Q&A/93/nl Created page with "Terwijl deze vraag over 'moeilijke' woorden gaat, hebben wij alleen woordenlijsten van eenvoudige woorden tot onze beschikking:" current
- 14:2314:23, 5 July 2024 diff hist −128 Translations:Q&A/45/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +299 N Translations:Q&A/92/nl Created page with "Het verzoek is of er enige gebruiksvriendelijke en gratis beschikbare hulpmiddelen zijn waarmee docenten het lexicale profiel van een tekst kunnen vaststellen (tot welke frequentieniveaus de woorden behoren, hoeveel van de meest frequente woorden de lezer zou moeten kennen om 95% te begrijpen etc.)" current
- 14:2314:23, 5 July 2024 diff hist −300 Translations:Q&A/42/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +44 N Translations:Q&A/91/nl Created page with "Zie de Eenvoudige_Taalverwerking pagina."
- 14:2314:23, 5 July 2024 diff hist −45 Translations:Q&A/41/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +367 N Translations:Q&A/90/nl Created page with "Lassy Groot is extreem groot en daarom niet geheel beschikbaar met behulp van online zoekhulpmiddelen zoals GrETEL en PaQu, alhoewel deze laatste toegang biedt tot het krantenonderdeel. Een suggestie is om de data te downloaden en dan te importeren naar een xml-databasemachine, zoals [https://basex.org/ Basex] die het toestaat om erin te zoeken met Xpath en Xquery." current
- 14:2314:23, 5 July 2024 diff hist −368 Translations:Q&A/40/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +109 N Translations:Q&A/89/nl Created page with "We hebben de n-gram-frequenties geteld tot aan trigrams en ze beschikbaar gemaakt op Letterteken_N-grams."
- 14:2314:23, 5 July 2024 diff hist −110 Translations:Q&A/39/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +331 N Translations:Q&A/88/nl Created page with "We hebben een overleg gehad waarin we het gebruik van spraakherkenning, segmentatie, sprekersdiarisatie en post-editing van spraakherkenning hebben besproken. We hebben het advies gegeven om K-Dutch te betrekken in het projectvoorstel zodat K-Dutch de ASR-output kan converteren naar ELAN-niveaus, ELAN-niveaus kan samenvoegen etc." current
- 14:2314:23, 5 July 2024 diff hist −332 Translations:Q&A/38/nl No edit summary current
- 14:2314:23, 5 July 2024 diff hist +117 N Translations:Q&A/87/nl Created page with "In principe is het mogelijk om beide opdrachten tegelijkertijd aan te vragen, zie het voorbeeld voor meer informatie." current
- 14:2314:23, 5 July 2024 diff hist −118 Translations:Q&A/36/nl No edit summary current
- 14:2214:22, 5 July 2024 diff hist +112 N Translations:Q&A/86/nl Created page with "Op [https://kdutch.ivdnt.org/wiki/Gesproken_corpora] hebben we verzameld wat beschikbaar is voor het Nederlands."
- 14:2214:22, 5 July 2024 diff hist −113 Translations:Q&A/34/nl No edit summary current
- 14:2214:22, 5 July 2024 diff hist +75 N Translations:Q&A/85/nl Created page with "We hebben nu een pagina over sentimentanalyse toegevoegd aan deze wiki."
- 14:2214:22, 5 July 2024 diff hist −76 Translations:Q&A/33/nl No edit summary current
- 14:2214:22, 5 July 2024 diff hist +492 N Translations:Q&A/84/nl Created page with "We vergelijken de Nederlandse en Turkse vertalingen van de Linguistic Inquiry and Word Count [LIWC] woordenboeken. Kent u enige corpora die geschikt zouden kunnen zijn? Ik heb verscheidene kandidaten gevonden op OPUS (https://opus.nlpl.eu/) en heb de TED2020-lezingen gedownload. Echter, dit zijn .xml-bestanden met paragraaf/lijn IDs en ik heb .txt-bestanden nodig. Heeft u wellicht een script of een manier om deze bestanden automatisch anders te coderen en de onnodige tag..." current
- 14:2214:22, 5 July 2024 diff hist −493 Translations:Q&A/31/nl No edit summary current
- 14:2214:22, 5 July 2024 diff hist +576 N Translations:Q&A/83/nl Created page with "De formule voor Flesch-Douma vereist twee dingen die geteld moeten worden: het aantal woorden in een zin en het aantal lettergrepen per woord. Terwijl het aantal woorden in een zin gemakkelijk te tellen is met elke scripttaal, lijkt het aantal lettergrepen moeilijker te tellen. Het [http://hdl.handle.net/10032/tm-a2-h2 e-Lex]-lexicon bevat woordafbrekingstekens en daarmee het aantal lettergrepen per woord. Een alternatief is om het aantal klinkerclusters in elk woord te..." current
- 14:2214:22, 5 July 2024 diff hist −577 Translations:Q&A/30/nl Replaced content with "==Hoe kan ik Flesch-Douma berekenen voor het Nederlands?==" current Tag: Replaced
- 14:2214:22, 5 July 2024 diff hist +101 N Translations:Q&A/82/nl Created page with "Er is een hulpmiddel genaamd [https://tscan.hum.uu.nl/tscan/ T-scan] dat wellicht nuttig is daarvoor." current
- 14:2214:22, 5 July 2024 diff hist −102 Translations:Q&A/29/nl No edit summary current
- 14:2214:22, 5 July 2024 diff hist +66 N Translations:Q&A/81/nl Created page with "Neem een kijkje op [https://kdutch.ivdnt.org/wiki/K-Dutch#Corpora]" current
- 14:2214:22, 5 July 2024 diff hist −67 Translations:Q&A/28/nl No edit summary current
- 14:2114:21, 5 July 2024 diff hist +252 N Translations:Q&A/80/nl Created page with "Er is zo geen expliciet corpus beschikbaar. Als we [https://kdutch.ivdnt.org/wiki/Treebank_querying#GrETEL GrETEL] een gebiedend voorbeeld aanbieden kunnen we gelijksoortige zinnen extraheren, die gebruikt zouden kunnen worden als een gebiedend corpus."
- 14:2114:21, 5 July 2024 diff hist −253 Translations:Q&A/27/nl No edit summary current
- 14:2114:21, 5 July 2024 diff hist +94 N Translations:Q&A/79/nl Created page with "We hebben de Treebanks pagina toegevoegd aan deze wiki om antwoord te geven op deze vraag."
- 14:2114:21, 5 July 2024 diff hist −4,568 Q&A/nl Created page with "We onderzoeken of het mogelijk is om dit te laten financieren door de [https://www.clarin.eu/content/clarin-resource-families-project-funding CLARIN Resource Families Projectfinanciering]. Deze site geeft aan dat het het beste is om het idee eerst informeel in te sturen naar het CLARIN-kantoor, zodat zij erover kunnen adviseren ('Gezien de flexibele aard van dit telefoongesprek worden aanvragers bemoedigd om een projectidee op voorhand in te sturen, om het CLARIN-kantoor..."
- 14:2114:21, 5 July 2024 diff hist −94 Translations:Q&A/26/nl No edit summary current
- 14:2114:21, 5 July 2024 diff hist +142 N Translations:Q&A/78/nl Created page with "Er is een permanente link voor de CGN-wave-bestanddownloadpagina: [http://hdl.handle.net/10032/tm-a2-k6 http://hdl.handle.net/10032/tm-a2-k6]" current
- 14:2114:21, 5 July 2024 diff hist −143 Translations:Q&A/25/nl No edit summary current
- 14:2114:21, 5 July 2024 diff hist +274 N Translations:Q&A/77/nl Created page with "Het [http://hdl.handle.net/10032/tm-a2-h2 e-Lex-lexicon] bevat als zijn derde dataveld de morfologie van lemma's. We hebben geteld per lemma-id dat een adjectief is voor de frequentie van het laatste achtervoegsel. Voor geen morfologie hebben we de categorie '0' toegewezen." current
- 14:2114:21, 5 July 2024 diff hist −275 Translations:Q&A/23/nl No edit summary current
- 14:2114:21, 5 July 2024 diff hist +341 N Translations:Q&A/76/nl Created page with "Het [http://hdl.handle.net/10032/tm-a2-h2 e-Lex-lexicon] bevat als zijn derde dataveld de morfologie van lemma's. We hebben alle rijen in de data geëxtraheerd waarin het teken voor afleiding (|) twee keer op rij voorkwam en de gebruiker een gedetailleerde lijst aangeboden van invoeropdrachten en hoe regelmatig deze voorkomen in het e-Lex." current
- 14:2114:21, 5 July 2024 diff hist −342 Translations:Q&A/21/nl No edit summary current