Parliamentary corpora/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
No edit summary
No edit summary
 
Line 1: Line 1:
We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar we hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zo veel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.  
We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar we hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zo veel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.  


Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement België (Frans & Nederlands)]. Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en  besluitvoering beschikbaar te stellen. Dit zal worden getest door het uitvoeren van een casusstudie naar het debat over de COVID-19 pandemie.
Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement van België (Frans & Nederlands)]. Het doel van het project is om geschikte onderzoeksgegevens beschikbaar te stellen van trends, opinies en  besluitvorming. Dit zal worden getest door het uitvoeren van een casusstudie naar het debat over de COVID-19-pandemie.


* [https://www.clarin.si/repository/xmlui/handle/11356/1432 Meertalige vergelijkende dataset beschikbaar]
* [https://www.clarin.si/repository/xmlui/handle/11356/1432 Meertalige vergelijkende dataset beschikbaar]
Line 8: Line 8:
== Europees Parlement data==
== Europees Parlement data==


[https://opus.nlpl.eu/Europarl.php Europarl data] op de OPUS website: een parallelle corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om statistisch machinevertalingsonderzoek te ondersteunen.
[https://opus.nlpl.eu/Europarl.php Europarl data] op de OPUS-website: een parallel corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om het statistischemachinevertalingsonderzoek te ondersteunen.

Latest revision as of 18:12, 25 March 2024

We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar we hebben wel gewerkt aan dit onderwerp in het kader van ParlaMint, een project dat als doel heeft om zo veel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.

Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige Federaal Parlement van België (Frans & Nederlands). Het doel van het project is om geschikte onderzoeksgegevens beschikbaar te stellen van trends, opinies en besluitvorming. Dit zal worden getest door het uitvoeren van een casusstudie naar het debat over de COVID-19-pandemie.

Europees Parlement data

Europarl data op de OPUS-website: een parallel corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om het statistischemachinevertalingsonderzoek te ondersteunen.