Investigating Boolean Matrix Factorization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985807%3A_____%2F08%3A00313987" target="_blank" >RIV/67985807:_____/08:00313987 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Investigating Boolean Matrix Factorization
Original language description
Matrix factorization or factor analysis is an important task helpful in the analysis of high dimensional real world data. There are several well known methods and algorithms for factorization of real data but many application areas including informationretrieval, pattern recognition and data mining often require processing of binary rather than real data. Unfortunately, the methods used for real matrix factorization fail in the latter case. In this paper we focus on the Boolean Matrix Factorization (BMF), introduce the task and present neural network, genetic algorithm and nonnegative matrix factorization based BMF solvers. The algorithms are tested on several data sets and their results are compared.
Czech name
O výzkumu Booleovské faktorové analýzy
Czech description
Rozklad matic respektive faktorová analýza je důležitá úloha v oblasti analýzy dat s vysokou dimenzí. Ve známost již vešlo mnoho metod a algoritmů pro data tvořená reálnými čísly, ale v mnoha aplikačních oblastech, např v oblasti dokumentografických systémů (IR), rozpoznávání vzorů (pattern recognition) a vytěžování dat (data mining), vzniká požadavek na analýzu binárních dat, kdy metody používané pro rozklad reálných matic jsou zcela nepoužitelné. V tomto příspěvku se zaměřujeme na Booleovskou faktorovou analýzu, která tento problém řeší. Přinášíme jak definici samotné jak samotné úlohy, tak řešící algoritmus založený ne neuronové síti a také metodu založenou na NMF. Algoritmy jsou testovány na standardních datových souborech a výsledky jsou pak porovnány.
Classification
Type
D - Article in proceedings
CEP classification
BB - Applied statistics, operational research
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Data Mining using Matrices and Tensors
ISBN
978-1-60558-307-5
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
ACM
Place of publication
-
Event location
Las Vegas
Event date
Aug 24, 2008
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—