Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378017%3A_____%2F11%3A00369190" target="_blank" >RIV/68378017:_____/11:00369190 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Popis výsledku v původním jazyce
Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazykůumožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.
Název v anglickém jazyce
The usage of an InterCorp parallel corpus to obtain equivalents for a Croatian-Czech dictionary
Popis výsledku anglicky
In the year 2010, the parallel Croatian-Czech corpus, which is part of the InterCorp project, exceeded 10 million tokens in both language versions and therefore it was possible to proceed to its practical use in finding equivalents for the Croatian-Czechdictionaries being prepared. The indicated size of the corpus has proved to be quite adequate for building a medium size dictionary, which should contain approximately 20 thousand entries. In the case of frequent entries, due to the confrontation of twolanguages, this corpus size is often adequate to capture the polysemy of words better than some existing explanatory or bilingual dictionaries. This is a great advantage, especially for the creation of bilingual dictionaries of two closely related languages.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Korpusová lingvistika Praha 2011
ISBN
978-80-7422-114-9
ISSN
—
e-ISSN
—
Počet stran výsledku
11
Strana od-do
45-55
Název nakladatele
Nakladatelství Lidové noviny
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
22. 9. 2011
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—