Zpracování česky psaných textových dokumentů Kohonenovou samoorganizující mapou
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000271" target="_blank" >RIV/49777513:23520/07:00000271 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Zpracování česky psaných textových dokumentů Kohonenovou samoorganizující mapou
Popis výsledku v původním jazyce
Kohonenova samoorganizující mapa byla navržena pro shlukování vstupních vektorů a mapování spojitého vícerozměrného signálu do diskrétního prostoru nižších dimenzí. Jednou z mnoha oblastí, ve kterých může být tato mapa využita, je i oblast zpracování textových dokumentů. V rámci projektu WEBSOM byla vytvořena řada metod založených na Kohonenově mapě. Tento článek se zabývá aplikací metody WEBSOM na kolekci česky psaných dokumentů. Je zde popsán základní princip metody, způsob převodu textové informace na číselnou reprezentaci zpracovávanou Kohonenovou mapou a možné další modifikace zmíněné metody.
Název v anglickém jazyce
Using Kohonen self-organizing feature map for Czech wirtten document processing
Popis výsledku anglicky
The Kohonen Self-organizing Feature Map (SOFM) has been developed for the clustering of input vectors and for projection of continuous high-dimensional signal to discrete low-dimensional space. The application area, where the map can be also used, is theprocessing of text documents. Within the project WEBSOM, the some methods, based on SOFM have been developed. These methods are suitable either for text documents information retrieval or for organizationof large document collections. All method have been tested on collections of english and finish written documents. This article deals with application of WEBSOM methods for czech-written documnts collections. The basic principles of WEBSOM methods, transformation of text information into the real componets feature vector and results of documents classification are described here.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06009" target="_blank" >2C06009: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Informatika v škole a v praxi
ISBN
978-80-8084-222-2
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
87-91
Název nakladatele
Pedagogická fakulta Katolíckej univerzity
Místo vydání
Ružomberok
Místo konání akce
Ružomberok
Datum konání akce
1. 1. 2007
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—