Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Korpus InterCorp, verze 14

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F22%3A10455087" target="_blank" >RIV/00216208:11210/22:10455087 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:verze14" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:intercorp:verze14</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpus InterCorp, verze 14

  • Popis výsledku v původním jazyce

    Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 42 jazyky (včetně češtiny). V porovnání s verzí 13 se počet slov v cizojazyčných textech zvýšil na 1 572 mil., z toho 349 mil. v beletristickém jádru a 1 223 mil. ve volně dostupných kolekcích. Počet slov v českých textech činí celkem 207 mil., z toho 118 mil. jádro a 90 mil. kolekce. Nově přibyly texty horní lužické srbštiny.

  • Název v anglickém jazyce

    The InterCorp corpus, release 14

  • Popis výsledku anglicky

    A new version of a large parallel corpus containing translations between a total of 42 languages (including Czech). Compared to version 13, the number of words in foreign texts increased to 1,572 million, including 349 million in the fiction core and 1,223 million in freely available collections. The total number of words in Czech texts is 207 million, including 118 million in the core and 90 million in the collections. Upper Sorbian texts were added.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2018137" target="_blank" >LM2018137: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2022

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    InterCorp v14

  • Technické parametry

    Soubor jazykových dat dostupný na http://korpus.cz

  • Ekonomické parametry

    Korpus je volně přístupný a primárně nevytváří žádný zisk

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova