Parliamentary corpora/nl: Difference between revisions

From Clarin K-Centre
Jump to navigation Jump to search
(Created page with "We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.")
 
(Created page with "Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement België (Frans & Nederlands)]. Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en besluitvoering beschikbaar te stellen. Dit zal worden getest...")
Line 1: Line 1:
We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.  
We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van [https://www.clarin.eu/content/parlamint-towards-comparable-parliamentary-corpora ParlaMint], een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.  


<div lang="en" dir="ltr" class="mw-content-ltr">
Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige [https://www.dekamer.be/kvvcr/index.cfm Federaal Parlement België (Frans & Nederlands)]. Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en  besluitvoering beschikbaar te stellen. Dit zal worden getest door het uitvoeren van een casusstudie naar het debat over de COVID-19 pandemie.
To this end, the different datasets must be converted to a uniform format and provided with linguistic information. The INT has implemented this for the bilingual [https://www.dekamer.be/kvvcr/index.cfm Belgian Federal Parliament (French & Dutch)]. The aim of the project is to provide suitable research data for targeted observations of trends, opinions and decision-making. This will be tested by conducting a case study of the debate on the COVID-19 epidemic.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
* [https://www.clarin.si/repository/xmlui/handle/11356/1432 Meertalige vergelijkende dataset beschikbaar]
* [https://www.clarin.si/repository/xmlui/handle/11356/1432 Multilingual comparable data set available]
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<span id="European_Parliament_data"></span>
== European Parliament data==
== Europees Parlement data==
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
[https://opus.nlpl.eu/Europarl.php Europarl data] op de OPUS website: een parallelle corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om statistisch machinevertalingsonderzoek te ondersteunen.
[https://opus.nlpl.eu/Europarl.php Europarl data] on the OPUS website: a parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
</div>

Revision as of 13:16, 13 March 2024

We hebben momenteel geen specifiek Nederlandse parlementaire corpora beschikbaar, maar hebben wel gewerkt aan dit onderwerp in het kader van ParlaMint, een project dat als doel heeft om zoveel mogelijk parlementaire corpora van verschillende Europese talen samen te brengen.

Om dit te realiseren moeten de verschillende datasets worden geconverteerd naar een eenduidige bestandsindeling en worden voorzien van taalkundige informatie. Het INT heeft dit geïmplementeerd voor het tweetalige Federaal Parlement België (Frans & Nederlands). Het doel van het project is om toepasbare onderzoeksgegevens van gerichte observaties van trends, opinies en besluitvoering beschikbaar te stellen. Dit zal worden getest door het uitvoeren van een casusstudie naar het debat over de COVID-19 pandemie.

Europees Parlement data

Europarl data op de OPUS website: een parallelle corpus geëxtraheerd van de website van het Europees Parlement door Philipp Koehn (Universiteit van Edinburgh). Het beoogde doel van deze data is om statistisch machinevertalingsonderzoek te ondersteunen.