All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Performance aspects of sparse matrix-vector multiplication

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03119698" target="_blank" >RIV/68407700:21230/07:03119698 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Performance aspects of sparse matrix-vector multiplication

  • Original language description

    Sparse matrix-vector multiplication (shortly SpMV) is an important building block in algorithms solving sparse systems of linear equations, e.g., FEM. Due to matrix sparsity, the memory access patterns are irregular and utilization of the cache can suffer from low spatial or temporal locality. Approaches to improve the performance of SpMV are based on matrix reordering and register blocking, sometimes combined with software-pipelining. Due to its overhead, register blocking achieves good speedups only for a large number of executions of SpMV with the same matrix A. We have investigated the impact of two simple SW transformation techniques (software-pipelining and loop unrolling) on the performance of SpMV, and have compared it with several implementation modifications aimed at reducing computational and memory complexity and improving the spatial locality. We investigate performance gains of these modifications on four CPU platforms.

  • Czech name

    Výkonnostní aspekty násobení řídké matice vektorem

  • Czech description

    Násobení řídké matice hustým vektorem je jednou ze základní operací numerické lineární algebry. Kvůli řídkosti vstupní matice, je schéma přístupu do paměti velmi nerovnoměrné, což znamená nízkou úspěšnost skrytých pamětí a z toho plyne nízká výkonnost celého algoritmu. Přístupy ke zvýšení rychlosti algoritmu jsou vesměs založeny na reorganizaci matice (matrix reordering) nebo nalezení hustých bloků v matici (register blocking) někdy v kombinaci s přednačtením prvků (software-pipelining). Tyto přístupy jsou časově velmi náročné proto se vyplatí pouze pro vykonání velkého počtu násobení stejnou maticí. V tomto článku jsme prozkoumali dopad 2 jednoduchých SW transformačních technik (sw-pipelining a loop unrolling) na výkonnost násobení a porovnali jsme tento dopad se změnami způsobenými rozdílnými implementacemi. Tyto dopady jsme změřili na 4 různých procesorových platformách.

Classification

  • Type

    J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)

  • CEP classification

    IN - Informatics

  • OECD FORD branch

Result continuities

  • Project

  • Continuities

    Z - Vyzkumny zamer (s odkazem do CEZ)

Others

  • Publication year

    2007

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Name of the periodical

    Acta Polytechnica

  • ISSN

    1210-2709

  • e-ISSN

  • Volume of the periodical

    2006

  • Issue of the periodical within the volume

    3

  • Country of publishing house

    CZ - CZECH REPUBLIC

  • Number of pages

    6

  • Pages from-to

    3-8

  • UT code for WoS article

  • EID of the result in the Scopus database