Nalezení slovních kořenů v češtině
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F11%3APU95967" target="_blank" >RIV/00216305:26230/11:PU95967 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Nalezení slovních kořenů v češtině
Popis výsledku v původním jazyce
Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českémjazyce vyskytovat.
Název v anglickém jazyce
Czech Stemming Algorithm
Popis výsledku anglicky
The goal was to create an algorithm for stemming Czech language based on grammatical rules, in addition to methods using vocabulary for retrieval and mining of Czech texts. The article includes the basics of Czech word formation for different word classes, description of problems and several stemming and lemmatization algorithms. The main contribution of this work is the implementation of the Snowball stemming algorithm for the Czech language based on complete sets of all prefixes and suffixes, which may occur in Czech words.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Znalosti 2011: Sborník příspěvků 10. ročníku konference
ISBN
978-80-248-2369-0
ISSN
—
e-ISSN
—
Počet stran výsledku
12
Strana od-do
66-77
Název nakladatele
VŠB Technická univerzita Ostrava
Místo vydání
Stará Lesná
Místo konání akce
Hotel Academia Stará Lesná
Datum konání akce
31. 1. 2011
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—