Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Paralelní korpus InterCorp po sedmi letech

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F11%3A10103865" target="_blank" >RIV/00216208:11210/11:10103865 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Paralelní korpus InterCorp po sedmi letech

  • Popis výsledku v původním jazyce

    Příspěvek představuje architekturu a současný stav paralelního korpusu InterCorp, včetně přehledu jeho vývoje a srovnání s jinými paralelními korpusy. Následuje popis způsobu sběru dat zahrnující kritéria pro výběr textů, formát dat, konverze, zarovnání,lemmatizaci a taggování. Příspěvek také popisuje dva používané nástroje, InterText (on-line editor zarovnání) a Park (rozhraní pro paralelní vyhledávání v textech). Závěrečná diskuse se zabývá výhledy do budoucna.

  • Název v anglickém jazyce

    Parallel corpus InterCorp seven years later

  • Popis výsledku anglicky

    The paper presents the architecture and the current state of the parallel corpus InterCorp, including an outline of its recent development and a comparison with other parallel corpora. This is followed by an overview of the data collection procedure thatcovers text selection criteria, data format, conversion, alignment, lemmatization and tagging. Among the specific tools, we focus on the on-line alignment editor InterText and the parallel search engine interface Park. Finally, we discuss challenges andprospects of the project.

Klasifikace

  • Druh

    C - Kapitola v odborné knize

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2011

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název knihy nebo sborníku

    Korpusová lingvistika Praha 2011 ? 2 Výzkum a výstavba korpusů

  • ISBN

    978-80-7422-115-6

  • Počet stran výsledku

    11

  • Strana od-do

    105-115

  • Počet stran knihy

    323

  • Název nakladatele

    Nakladatelství Lidové noviny

  • Místo vydání

    Praha

  • Kód UT WoS kapitoly