Korpus InterCorp, verze 15
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F22%3A10452543" target="_blank" >RIV/00216208:11210/22:10452543 - isvavai.cz</a>
Výsledek na webu
<a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:verze15" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:intercorp:verze15</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpus InterCorp, verze 15
Popis výsledku v původním jazyce
Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 42 jazyky (včetně češtiny). Počet slov v cizojazyčných textech se zvýšil na 1 588 mil., z toho 362 mil. v beletristickém jádru a 1 226 mil. ve volně dostupných kolekcích. Počet slov v českých textech činí celkem 210 mil., z toho 120 mil. jádro a 90 mil. kolekce. V kolekci Project Syndicate přibyly texty za roky 2019 až 2021, nově také texty čínské a arabské.
Název v anglickém jazyce
The InterCorp corpus, release 15
Popis výsledku anglicky
A new version of a large parallel corpus containing translations between a total of 42 languages (including Czech). The number of words in foreign texts increased to 1 588 million, including 362 million in the fiction core and 1 226 million in freely available collections. The total number of words in Czech texts is 210 million, including 120 million in the core and 90 million in the collections. The Project Syndicate collection now includes additional texts from 2019-2021, including texts in Chinese and Arabic.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2018137" target="_blank" >LM2018137: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
InterCorp v15
Technické parametry
Soubor jazykových dat dostupný na http://korpus.cz
Ekonomické parametry
Korpus je volně přístupný a primárně nevytváří žádný zisk
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova v Praze