Comparing MapReduce-Based k-NN Similarity Joins On Hadoop For High-dimensional Data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F17%3A10366491" target="_blank" >RIV/00216208:11320/17:10366491 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-69179-4_5" target="_blank" >http://dx.doi.org/10.1007/978-3-319-69179-4_5</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-69179-4_5" target="_blank" >10.1007/978-3-319-69179-4_5</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Comparing MapReduce-Based k-NN Similarity Joins On Hadoop For High-dimensional Data
Popis výsledku v původním jazyce
Similarity joins represent a useful operator for data mining, data analysis and data exploration applications. With the exponential growth of data to be analyzed, distributed approaches like MapReduce are required. So far, the state-of-the-art similarity join approaches based on MapReduce mainly focused on the processing of vector data with less than one hundred dimensions. In this paper, we revisit and investigate the performance of different MapReduce-based approximate k-NN similarity join approaches on Apache Hadoop for large volumes of high-dimensional vector data.
Název v anglickém jazyce
Comparing MapReduce-Based k-NN Similarity Joins On Hadoop For High-dimensional Data
Popis výsledku anglicky
Similarity joins represent a useful operator for data mining, data analysis and data exploration applications. With the exponential growth of data to be analyzed, distributed approaches like MapReduce are required. So far, the state-of-the-art similarity join approaches based on MapReduce mainly focused on the processing of vector data with less than one hundred dimensions. In this paper, we revisit and investigate the performance of different MapReduce-based approximate k-NN similarity join approaches on Apache Hadoop for large volumes of high-dimensional vector data.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA15-08916S" target="_blank" >GA15-08916S: Efektivní identifikace podgrafů při analýze webových grafů velikosti petabajtů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Advanced Data Mining and Applications
ISBN
978-3-319-69178-7
ISSN
0302-9743
e-ISSN
neuvedeno
Počet stran výsledku
13
Strana od-do
63-75
Název nakladatele
Springer
Místo vydání
Berlin
Místo konání akce
Singapore
Datum konání akce
5. 11. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—