Nástroj pro kategorizaci slov z česky psaných dokumentů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F10%3A00504272" target="_blank" >RIV/49777513:23520/10:00504272 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Nástroj pro kategorizaci slov z česky psaných dokumentů
Popis výsledku v původním jazyce
Tento nástroj umožňuje kategorizaci česky psaných slov, získaných ze vstupních dokumentů. Kategorizace se provádí hierarchickou umělou neuronovou sítí GHSOM, složenou z několika samoorganizujících se map (SOM). Aplikace umožňuje vytvoření sítě GHSOM jejínatrénování a vizualizaci výsledků kategorizace. Výsledky kategorizace slov z dokumentů zvoleného korpusu je popsána v článku ?Clustering of Words from Czech Written Documents Using SOM? publikovaném ve sborníku konference GCIS2010. Uživatelská příručka, kompletní popis sítě GHSOM, zmíněný článek z konference GCIS2010 a nástroj pro vytvoření vstupů sítě GHSOM z textových dokumentů jsou také obsaženy v archivu. Uvedený nástroj vznikl v rámci výzkumného projektu 2C06009 Cot-sewing.
Název v anglickém jazyce
Software tool for categorization of words from Czech-written documents
Popis výsledku anglicky
This software tool can be used for categorization of words acquired from the Czech-written input documents. The categorization is made by the hierarchical artificial neural network GHSOM (Growing Hierarchical Self-Organizing Map) composed from a severalself-organizing map (SOM). The application provides GHSOM network creation, training and visualization of results of the categorization. The categorization of words from Czech-written documents was also described in the article ?Clustering of Words fromCzech Written Documents Using GHSOM? published in the proceding of GCIS2010 conference. The GHSOM user guide, detailed description of GHSOM network, above mentioned GCIS2010 article and the software tool for generation of GHSOM input vectors are also included in the archive. This software tool was developed within the research project No. 2C06009 Cot-Sewing.
Klasifikace
Druh
R - Software
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06009" target="_blank" >2C06009: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
GHSOM kategorizátor slov
Technické parametry
Mautner P. ZČU Plzeň 377632441
Ekonomické parametry
Urychlení kategorizace slov
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni, KIV