Víceslovné výrazy a klasifikace českých textů

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F04%3A00010075" target="_blank" >RIV/00216224:14330/04:00010075 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Jazyk výsledku
čeština
Název v původním jazyce
Víceslovné výrazy a klasifikace českých textů
Popis výsledku v původním jazyce
Presentujeme první výsledky experimentů týkající se použití víceslovných výrazů pro klasifikaci českých textů. Podáváme přehled nejdelších, nejčastěji použitých a nejužitečnějších víceslovných skupin. Všímáme si též vlivu lematizace na přesnost klasifikace textů.
Název v anglickém jazyce
Multiword expressions and Czech document classification
Popis výsledku anglicky
The use of chunks - noun, verb and prepositional phrases - as new features in Czech text classification is discussed, and the most interesting as well as the most useful chunks found are introduced. We also mention the role of lemmatization in Czech textclassification.

Rok uplatnění
2004
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Podobné výsledky(10)