Workflow and Metadata Challenges in the ParlaMint Project: Insights from Building the ParlaMint-UA Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F23%3A10475893" target="_blank" >RIV/00216208:11320/23:10475893 - isvavai.cz</a>
Výsledek na webu
<a href="https://office.clarin.eu/v/CE-2023-2328_CLARIN2023_ConferenceProceedings.pdf#page=75" target="_blank" >https://office.clarin.eu/v/CE-2023-2328_CLARIN2023_ConferenceProceedings.pdf#page=75</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Workflow and Metadata Challenges in the ParlaMint Project: Insights from Building the ParlaMint-UA Corpus
Popis výsledku v původním jazyce
The speeches in ParlaMint corpora of parliamentary proceedings are marked by their speaker, and the speakers are then paired with various metadata, also with their time-delimited affiliations with political parties or parliamentary groups. These are stored separately, and are also associated with further information. This paper discusses the addition of metadata on political parties and parliamentary groups, encoding their political position on various issues, in particular their categorisation on the left-to-right political spectrum. The paper explains our sources for this information, the process of data collection, and its encoding in the corpora. This additional metadata should be of interest to parliamentary data research, while the methodology developed could be used to add further metadata to the ParlaMint corpora.
Název v anglickém jazyce
Workflow and Metadata Challenges in the ParlaMint Project: Insights from Building the ParlaMint-UA Corpus
Popis výsledku anglicky
The speeches in ParlaMint corpora of parliamentary proceedings are marked by their speaker, and the speakers are then paired with various metadata, also with their time-delimited affiliations with political parties or parliamentary groups. These are stored separately, and are also associated with further information. This paper discusses the addition of metadata on political parties and parliamentary groups, encoding their political position on various issues, in particular their categorisation on the left-to-right political spectrum. The paper explains our sources for this information, the process of data collection, and its encoding in the corpora. This additional metadata should be of interest to parliamentary data research, while the methodology developed could be used to add further metadata to the ParlaMint corpora.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2023062" target="_blank" >LM2023062: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
CLARIN Annual Conference Proceedings 2023
ISBN
—
ISSN
2773-2177
e-ISSN
—
Počet stran výsledku
4
Strana od-do
67-70
Název nakladatele
CLARIN ERIC
Místo vydání
Leuven, Belgium
Místo konání akce
Leuven, Belgium
Datum konání akce
16. 10. 2023
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—