InterCorp multilingual parallel corpus and its Croatian component
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F23%3A10468508" target="_blank" >RIV/00216208:11210/23:10468508 - isvavai.cz</a>
Výsledek na webu
<a href="https://zagrebacka-slavisticka-skola.com/upload/zbornici/ZSS_2023.pdf" target="_blank" >https://zagrebacka-slavisticka-skola.com/upload/zbornici/ZSS_2023.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
chorvatština
Název v původním jazyce
Višejezični paralelni korpus InterCorp i njegova hrvatska sastavnica
Popis výsledku v původním jazyce
Ovaj rad želi prikazati višejezični paralelni korpus InterCorp te istaknuti njegov potencijalni doprinos za mogućnosti istraživanja ne samo slavenskih, već i drugih jezika. InterCorp je paralelni jezični korpus koji nakon 15 godina svog razvoja pokriva 42 jezika, uključujući sve slavenske jezike. Služi kao izvor podataka za teorijske studije, leksikografiju, studentska istraživanja, učenje jezika, računalne aplikacije, prevoditelje, ali i za širu javnost. Glavni dio tog korpusa predstavljaju književna djela prevedena na više jezika, no u zadnjim godinama poseban dio tog korpusa čini i publicistika, administrativni i pravni tekstovi. Hrvatska sastavnica je, zasad, zastupljena samo beletrističkim tekstovima i filmskim podnaslovima. Zahvaljujući svojoj koncepciji ovaj korpus omogućuje uočiti strukturne razlike i sličnosti između pojedinih jezika, no i usporediti realnu primjenu pojedinih jezičnih pojava u današnjim jezicima. Iako je InterCorp pretežno sinkroni korpus, uključuje beletrističke tekstove od pedesetih godina 20. stoljeća do danas, pa može doprinijeti također istraživanju jezične dinamike i promjena jezičnog uzusa u tom razdoblju.
Název v anglickém jazyce
InterCorp multilingual parallel corpus and its Croatian component
Popis výsledku anglicky
This paper aims to present the multilingual parallel corpus InterCorp and to highlight its potential contribution to the research possibilities of not only Slavic but also other languages. Intercorp is a parallel linguistic corpus that covers 42 languages after 15 years of development, including all Slavic languages. It serves as a source of data for theoretical studies, lexicography, student research, language teaching, computer applications, translators, as well as for the general public. The main part of this corpus is literary works translated into several languages, but in recent years a special part of this corpus has also been publicistic, administrative and legal texts. For the time being, the Croatian component is represented only by fiction texts and film subtitles. Thanks to its concept, this corpus allows not only investigating of structural differences and similarities between languages, but also compares the actual use of individual linguistic phenomena in today's languages. Although Intercorp is predominantly a synchronic corpus, it includes fiction texts from the 1950s to the present, so it can also contribute to the study of linguistic dynamics and changes in linguistic usage during this period.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů