Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Korpus InterCorp, verze 15

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F22%3A10452543" target="_blank" >RIV/00216208:11210/22:10452543 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:verze15" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:intercorp:verze15</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpus InterCorp, verze 15

  • Popis výsledku v původním jazyce

    Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 42 jazyky (včetně češtiny). Počet slov v cizojazyčných textech se zvýšil na 1 588 mil., z toho 362 mil. v beletristickém jádru a 1 226 mil. ve volně dostupných kolekcích. Počet slov v českých textech činí celkem 210 mil., z toho 120 mil. jádro a 90 mil. kolekce. V kolekci Project Syndicate přibyly texty za roky 2019 až 2021, nově také texty čínské a arabské.

  • Název v anglickém jazyce

    The InterCorp corpus, release 15

  • Popis výsledku anglicky

    A new version of a large parallel corpus containing translations between a total of 42 languages (including Czech). The number of words in foreign texts increased to 1 588 million, including 362 million in the fiction core and 1 226 million in freely available collections. The total number of words in Czech texts is 210 million, including 120 million in the core and 90 million in the collections. The Project Syndicate collection now includes additional texts from 2019-2021, including texts in Chinese and Arabic.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2018137" target="_blank" >LM2018137: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2022

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    InterCorp v15

  • Technické parametry

    Soubor jazykových dat dostupný na http://korpus.cz

  • Ekonomické parametry

    Korpus je volně přístupný a primárně nevytváří žádný zisk

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova v Praze