Vlastnosti prostoru sousedů
Popis výsledku
Vzdálenost nejbližšího souseda nebo několika nejbližších sousedů je významná pro odhad hustoty pravděpodobnosti metodou nejbližších sousedů nebo u problémy hledání v rozsáhlých databázích. Typická úloha odhadu pravděpodobnosti s použitím několika nejbližších sousedů je Bayesův klasifikátor. Úloha hledání v databázích znamená hledání nejbližších sousedních dotazů. V článku se ukazuje, že rovnoměrně rozdělené body v n-rozměrném Euklidově prostoru mají vzdálenosti i-tých nejbližších sousedů umocněné na n-tou právě Erlangovo rozdělení. Zavádí se mocninná aproximace nově zavedené mapovací funkce rozdělení vzdáleností k nejbližším sousedům. Ukazuje se, jak stanovit tento exponent pro odhad hustoty rozdělení se zahrnutím okrajových jevů ve vyšších dimensích.
Klíčová slova
distribution mapping functionpower applicationnearest neighborboundary effect
Identifikátory výsledku
Kód výsledku v IS VaVaI
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Features of Neighbors Spaces
Popis výsledku v původním jazyce
Distances of the nearest neighbor or several nearest neighbors are essential in probability density estimate by the method of k nearest neighbors or in problems of searching in large databases. A typical task of the probability density estimate using several nearest neighbors is the Bayes s classifier. The task of searching in large databases is looking for other nearest neighbor queries. In this paper it is shown that for a uniform distribution of points in an n-dimensional Euclidean space the distribution of the distance of the i-th nearest neighbor to the n-power has Erlang distribution. The power approximation of the newly introduced probability distribution mapping function of distances of nearest neighbors in the form of suitable power of the distance is presented. A way to state distribution mapping exponent q for a probability density estimation including boundary effect in high dimensions is shown.
Název v anglickém jazyce
Features of Neighbors Spaces
Popis výsledku anglicky
Distances of the nearest neighbor or several nearest neighbors are essential in probability density estimate by the method of k nearest neighbors or in problems of searching in large databases. A typical task of the probability density estimate using several nearest neighbors is the Bayes s classifier. The task of searching in large databases is looking for other nearest neighbor queries. In this paper it is shown that for a uniform distribution of points in an n-dimensional Euclidean space the distribution of the distance of the i-th nearest neighbor to the n-power has Erlang distribution. The power approximation of the newly introduced probability distribution mapping function of distances of nearest neighbors in the form of suitable power of the distance is presented. A way to state distribution mapping exponent q for a probability density estimation including boundary effect in high dimensions is shown.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BA - Obecná matematika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2004
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
SOFSEM 2004: Theory and Practice of Computer Science
ISBN
3-540-20779-1
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
241-248
Název nakladatele
SpringerVerlag
Místo vydání
Berlin
Místo konání akce
Měřín
Datum konání akce
24. 1. 2004
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—
Druh výsledku
D - Stať ve sborníku
CEP
BA - Obecná matematika
Rok uplatnění
2004