Korpus InterCorp, verze 14
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F22%3A10455087" target="_blank" >RIV/00216208:11210/22:10455087 - isvavai.cz</a>
Výsledek na webu
<a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:verze14" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:intercorp:verze14</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpus InterCorp, verze 14
Popis výsledku v původním jazyce
Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 42 jazyky (včetně češtiny). V porovnání s verzí 13 se počet slov v cizojazyčných textech zvýšil na 1 572 mil., z toho 349 mil. v beletristickém jádru a 1 223 mil. ve volně dostupných kolekcích. Počet slov v českých textech činí celkem 207 mil., z toho 118 mil. jádro a 90 mil. kolekce. Nově přibyly texty horní lužické srbštiny.
Název v anglickém jazyce
The InterCorp corpus, release 14
Popis výsledku anglicky
A new version of a large parallel corpus containing translations between a total of 42 languages (including Czech). Compared to version 13, the number of words in foreign texts increased to 1,572 million, including 349 million in the fiction core and 1,223 million in freely available collections. The total number of words in Czech texts is 207 million, including 118 million in the core and 90 million in the collections. Upper Sorbian texts were added.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2018137" target="_blank" >LM2018137: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
InterCorp v14
Technické parametry
Soubor jazykových dat dostupný na http://korpus.cz
Ekonomické parametry
Korpus je volně přístupný a primárně nevytváří žádný zisk
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova