Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Korpus InterCorp, verze 12

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F19%3A10402532" target="_blank" >RIV/00216208:11210/19:10402532 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:intercorp</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpus InterCorp, verze 12

  • Popis výsledku v původním jazyce

    Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 41 jazyky (včetně češtiny). V porovnání s verzí 11 se počet slov v cizojazyčných textech zvýšil na 1 534 mil., z toho 311 mil. v beletristickém jádru a 1 223 mil. ve volně dostupných kolekcích. Počet slov v českých textech činí celkem 200 mil., z toho 111 mil. jádro a 90 mil. kolekce. Nově přibyly čínské texty, včetně slovnědruhových značek.

  • Název v anglickém jazyce

    The InterCorp corpus, release 12

  • Popis výsledku anglicky

    A new version of a large parallel corpus containing translations between a total of 41 languages (including Czech). Compared to version 11, the number of words in foreign texts increased to 1,534 million, including 311 million in the fiction core and 1,223 million in freely available collections. The total number of words in Czech texts is 200 million, including 111 million in the core and 90 million in the collections. Chinese texts, including POS tags, were added.

Klasifikace

  • Druh

    S<sub>db</sub> - Specializovaná veřejná databáze

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2015044" target="_blank" >LM2015044: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2019

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Číslo předpisu

    LM2015044/InterCorp_v12

  • Označení certifikačního orgánu

    Ministerstvo školství, mládeže a tělovýchovy České republiky, Karmelitská 529/5, 118 00 Praha 1

  • Datum certifikace