FAST SUPERVISED FEATURE EXTRACTION FROM STRUCTURED REPRESENTATION OF TEXT DATA
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F10%3A00171783" target="_blank" >RIV/68407700:21230/10:00171783 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21240/10:00171783
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
FAST SUPERVISED FEATURE EXTRACTION FROM STRUCTURED REPRESENTATION OF TEXT DATA
Popis výsledku v původním jazyce
Classification of text documents is challenging problem not only when browsing the web. Structure representation of documents is necessary to build up appropriate classifier. Unfortunately the document-term matrices are usually so sparse and of high dimensionality due large number of terms representing usually smaller number of the documents. Thus the suitable dimensionality reduction technique is required to be able to develop the classifier. The article deals with supervised extraction method that results to small number of sensitive features derived from the initial document-term matrix. The extraction process simulated by neural network is remarkably fast and utilizes all available supervised information from training data.
Název v anglickém jazyce
FAST SUPERVISED FEATURE EXTRACTION FROM STRUCTURED REPRESENTATION OF TEXT DATA
Popis výsledku anglicky
Classification of text documents is challenging problem not only when browsing the web. Structure representation of documents is necessary to build up appropriate classifier. Unfortunately the document-term matrices are usually so sparse and of high dimensionality due large number of terms representing usually smaller number of the documents. Thus the suitable dimensionality reduction technique is required to be able to develop the classifier. The article deals with supervised extraction method that results to small number of sensitive features derived from the initial document-term matrix. The extraction process simulated by neural network is remarkably fast and utilizes all available supervised information from training data.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 7th EUROSIM Congress on Modelling and Simulation, Vol. 2: Full Papers
ISBN
978-80-01-04589-3
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
—
Název nakladatele
Department of Computer Science and Engineering, FEE, CTU in Prague
Místo vydání
Prague
Místo konání akce
Praha
Datum konání akce
6. 9. 2010
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—