Nový přístup ke zrychlení násobení řídké matice vektorem
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03127682" target="_blank" >RIV/68407700:21230/07:03127682 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A New Approach for Accelerating the Sparse Matrix-vector Multiplication
Popis výsledku v původním jazyce
Sparse matrix-vector multiplication (shortly spMV) is one of most common subroutines in the numerical linear algebra. The problem is that the memory access patterns during the spMV are irregular and the utilization of cache can suffer from low spatial ortemporal locality. This paper introduces new approach for the acceleration the spMV. This approach consists of 3 steps: 1) dividing matrix A into non-empty regions, 2) choosing an efficient way to traverse these regions (in another words choosing an efficient ordering of partial multiplications), 3) choosing the optimal type of storage for each region. In this paper, we describe aspects of these 3 steps in more detail (including fast and time-inexpensive algorithms for all steps). Our measurements proved that our approach gives a significant speedup for almost all matrices arising from various technical areas.
Název v anglickém jazyce
A New Approach for Accelerating the Sparse Matrix-vector Multiplication
Popis výsledku anglicky
Sparse matrix-vector multiplication (shortly spMV) is one of most common subroutines in the numerical linear algebra. The problem is that the memory access patterns during the spMV are irregular and the utilization of cache can suffer from low spatial ortemporal locality. This paper introduces new approach for the acceleration the spMV. This approach consists of 3 steps: 1) dividing matrix A into non-empty regions, 2) choosing an efficient way to traverse these regions (in another words choosing an efficient ordering of partial multiplications), 3) choosing the optimal type of storage for each region. In this paper, we describe aspects of these 3 steps in more detail (including fast and time-inexpensive algorithms for all steps). Our measurements proved that our approach gives a significant speedup for almost all matrices arising from various technical areas.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of Workshop 2007
ISBN
978-80-01-03667-9
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
—
Název nakladatele
ČVUT
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
19. 2. 2007
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—