Tvorba, funkce a využití Česko-německého paralelního korpusu

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14410%2F07%3A00022753" target="_blank" >RIV/00216224:14410/07:00022753 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Tvorba, funkce a využití Česko-německého paralelního korpusu
Popis výsledku v původním jazyce
Neexistence česko-německého paralelního korpusu (ČNPK) přiměla autory k jeho tvorbě již na sklonku 20. století. Práce na něm začaly v roce 2001 a již na začátku roku 2005 obsahoval více než 6,5 milionů textových slov jen v české paralele. Článek seznamuje se základními technickými i textovými parametry korpusu a uvádí příklady práce s tímto jedinečný instrumentem. Korpus bude částečně přístupný v rámci projektu multijazykového korpusu "Intercorp".
Název v anglickém jazyce
Construction, Functions and Usage of the Czech-German Parallel Corpus
Popis výsledku anglicky
The absence of a Czech-German parallel corpus ended in 2001 with the start of construction of The Czech-German parallel Corpus (CNPK) by the authors of this article. The CNPK runs under Bonito interface (the same as the CNC). It consists of two independent but linked parallels with a total of more than 6,5 million text words. The corpus is manually aligned, automatically tagged in both parts (tagger Ajka in the Czech part; Tree-Tagger in the German part). The CNPK is a general synchronic corpus trying to cover as many stylistic features as possible: texts preferably not older than 50 years; balanced in style: 50% fiction, 50% non-fiction (scientific texts from potentially all fields and public, esp. journalistic texts in the wider meaning). Obviously,there are no texts of the spoken language. All texts are of either Czech or German origin (no "third langue" texts). The CNPK will be partly accessible as a part of the multilingual corpus INTERCORP (https://trnka.ff.cuni.cz/ucnk/intercor

Klasifikace

Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—

Návaznosti výsledku

Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název statě ve sborníku
Gramatika a korpus / Grammar & Corpora 2005
ISBN
80-86496-32-5
ISSN
—
e-ISSN
—
Počet stran výsledku
13
Strana od-do
205-217
Název nakladatele
Ústav pro jazyk český Akademie věd České republiky
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
1. 1. 2005
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—

Podobné výsledky(10)

Korpus InterCorp, verze 13 Czech equivalents of German determinative compoounds. On the use of parallel corpora for cotnrastive linguistic studies Lexical Expressivity in Czech and English Fiction in Czech National Corpus – A Comparative Analysis

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Tvorba, funkce a využití Česko-německého paralelního korpusu

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)