Interactive Mining on Hierarchical Data
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F07%3APU73631" target="_blank" >RIV/00216305:26230/07:PU73631 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Interactive Mining on Hierarchical Data
Original language description
In this paper, we propose a framework for interactive, iterative, and intuitive mining of multilevel association, characterization and classification rules on data organized in multi-level conceptual hierarchies. This framework is called OLAM SE (Self Explaining On-Line Analytical Mining) and it is proposed as an extension of OLAP or as an alternative to Han's OLAM. OLAM processes data stored in data cubes structure of which is based on a given conceptual hierarchy. OLAM SE determines minimum support value from user defined cover value of data with usage of entropy coding principle. It also automatically determines the maximum threshold to avoid explaining knowledge that is obvious and so potentially uninteresting. Major part of data is thus describedby frequent patterns. The presentation of results is inspired by UML diagram notation. It contains a graph nodes of which are frequent data sets represented as packages including sub packages - data classes or items. Edges represent relat
Czech name
Interaktivní dolování dat nad hierarchickými daty
Czech description
V této práci předkládáme rámec pro interakitvní, iteraticní a intuitivní dolování víceúrovňových asociačních, charakterizačních a klasifikačních pravidel nad daty organizovánými ve víceúrovňových konceptuálních hierarchiích. Tento rámec se nazývá OLAM SE(Self Explaining On-Line Analytical Mining) a je předpokládán jako rozšíření OLAPu nebo jako alternatica k Hanovu OLAMu. OLAM zpracovává data uložená ve struktuře datových kostek, která je založena na dané konceptuální hierarchii. OLAM SE určuje hodnotu minimální podpory z uživatelem definované hodnoty pokrytí dat za použití principu kódování entropie. Stejně tak určuje maximální prahovou hodnotu k zamezení zkoumání znalosti, která je zřejmá a potencionálně nezajímavá. Hlavní část dat je tudíž popsána pomocí frekventovaných vzorů. Prezentace výsledků je inspirována notací UML diagamů. Zahrnuje uzly grafu, kterými jsou frekventované množiny dat reprezentov
Classification
Type
D - Article in proceedings
CEP classification
BC - Theory and management systems
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 13th Conference STUDENT EEICT 2007 Volume 4
ISBN
978-80-214-3410-3
ISSN
—
e-ISSN
—
Number of pages
5
Pages from-to
410-414
Publisher name
Brno University of Technology
Place of publication
Brno
Event location
Brno
Event date
Apr 26, 2007
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—