Víceslovné výrazy a klasifikace českých textů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F04%3A00010075" target="_blank" >RIV/00216224:14330/04:00010075 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Víceslovné výrazy a klasifikace českých textů
Popis výsledku v původním jazyce
Presentujeme první výsledky experimentů týkající se použití víceslovných výrazů pro klasifikaci českých textů. Podáváme přehled nejdelších, nejčastěji použitých a nejužitečnějších víceslovných skupin. Všímáme si též vlivu lematizace na přesnost klasifikace textů.
Název v anglickém jazyce
Multiword expressions and Czech document classification
Popis výsledku anglicky
The use of chunks - noun, verb and prepositional phrases - as new features in Czech text classification is discussed, and the most interesting as well as the most useful chunks found are introduced. We also mention the role of lemmatization in Czech textclassification.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2004
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Znalosti 2004, sborník posterů
ISBN
—
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
53-56
Název nakladatele
VŠB--Technická univerzita Ostrava
Místo vydání
Ostrava
Místo konání akce
Hotel SANTON, Brno
Datum konání akce
22. 2. 2004
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—