Catalan Parliamentary Plenary Session Transcriptions from 2015 to 2022. The ParlaMintCAT Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F23%3ASTVEMFGW" target="_blank" >RIV/00216208:11320/23:STVEMFGW - isvavai.cz</a>
Výsledek na webu
<a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85174835820&doi=10.26342%2f2023-71-10&partnerID=40&md5=85f1a8274def01f70bc8b6a8957c53e2" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85174835820&doi=10.26342%2f2023-71-10&partnerID=40&md5=85f1a8274def01f70bc8b6a8957c53e2</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.26342/2023-71-10" target="_blank" >10.26342/2023-71-10</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Catalan Parliamentary Plenary Session Transcriptions from 2015 to 2022. The ParlaMintCAT Corpus
Popis výsledku v původním jazyce
"Parliamentary speeches are considered to be of interest for different research areas because they are publicly available transcriptions, produced under controlled and regulated procedures that add totally reliable sociodemographic data like gender, age, and other details of the speakers. Moreover, speeches are rich in topics and domains, and they are actually public domain data, not subject to copyright restrictions. The ParlaMint project: Towards Comparable Parliamentary Corpora is developing a comparable and uniformly annotated multilingual corpus with the data from 33 different parliaments in Europe. This paper describes the details of building the ParlaMintCAT corpus, for which the transcriptions of the Catalan Parliament General Assembly sessions from 2015 to 2022 have been compiled, processed and annotated. ©2023 Sociedad Española para el Procesamiento del Lenguaje Natural."
Název v anglickém jazyce
Catalan Parliamentary Plenary Session Transcriptions from 2015 to 2022. The ParlaMintCAT Corpus
Popis výsledku anglicky
"Parliamentary speeches are considered to be of interest for different research areas because they are publicly available transcriptions, produced under controlled and regulated procedures that add totally reliable sociodemographic data like gender, age, and other details of the speakers. Moreover, speeches are rich in topics and domains, and they are actually public domain data, not subject to copyright restrictions. The ParlaMint project: Towards Comparable Parliamentary Corpora is developing a comparable and uniformly annotated multilingual corpus with the data from 33 different parliaments in Europe. This paper describes the details of building the ParlaMintCAT corpus, for which the transcriptions of the Catalan Parliament General Assembly sessions from 2015 to 2022 have been compiled, processed and annotated. ©2023 Sociedad Española para el Procesamiento del Lenguaje Natural."
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
"Procesamiento del Lenguaje Natural"
ISSN
1135-5948
e-ISSN
—
Svazek periodika
""
Číslo periodika v rámci svazku
71
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
12
Strana od-do
125-136
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85174835820