Paralelní korpus InterCorp po sedmi letech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F11%3A10103865" target="_blank" >RIV/00216208:11210/11:10103865 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Paralelní korpus InterCorp po sedmi letech
Popis výsledku v původním jazyce
Příspěvek představuje architekturu a současný stav paralelního korpusu InterCorp, včetně přehledu jeho vývoje a srovnání s jinými paralelními korpusy. Následuje popis způsobu sběru dat zahrnující kritéria pro výběr textů, formát dat, konverze, zarovnání,lemmatizaci a taggování. Příspěvek také popisuje dva používané nástroje, InterText (on-line editor zarovnání) a Park (rozhraní pro paralelní vyhledávání v textech). Závěrečná diskuse se zabývá výhledy do budoucna.
Název v anglickém jazyce
Parallel corpus InterCorp seven years later
Popis výsledku anglicky
The paper presents the architecture and the current state of the parallel corpus InterCorp, including an outline of its recent development and a comparison with other parallel corpora. This is followed by an overview of the data collection procedure thatcovers text selection criteria, data format, conversion, alignment, lemmatization and tagging. Among the specific tools, we focus on the on-line alignment editor InterText and the parallel search engine interface Park. Finally, we discuss challenges andprospects of the project.
Klasifikace
Druh
C - Kapitola v odborné knize
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název knihy nebo sborníku
Korpusová lingvistika Praha 2011 ? 2 Výzkum a výstavba korpusů
ISBN
978-80-7422-115-6
Počet stran výsledku
11
Strana od-do
105-115
Počet stran knihy
323
Název nakladatele
Nakladatelství Lidové noviny
Místo vydání
Praha
Kód UT WoS kapitoly
—