Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F12%3A00057469" target="_blank" >RIV/00216224:14330/12:00057469 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method
Popis výsledku v původním jazyce
The element subroutines in finite element method (FEM) provides enough parallelism to be successfully accelerated by contemporary GPUs. However, their efficient implementation is not straightforward and requires time-consuming exploration of numerous implementation variants. In this paper, we present optimization by kernel fusion for element subroutines. Moreover, we show how the optimization is automated using our source-to-source compiler. We demonstrate the optimization of the element subroutines forFEM model using St.,Venant-Kirchhoff material. The performance of code generated by our compiler outperforms our previously published hand-tuned implementation by factor of 1.32 -- 1.54 depending on used GPU architecture. Although the optimization technique is demonstrated on element subroutines for using St.,Venant-Kirchhoff material, it is generally usable for wider area of computationally-demanding problems.
Název v anglickém jazyce
Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method
Popis výsledku anglicky
The element subroutines in finite element method (FEM) provides enough parallelism to be successfully accelerated by contemporary GPUs. However, their efficient implementation is not straightforward and requires time-consuming exploration of numerous implementation variants. In this paper, we present optimization by kernel fusion for element subroutines. Moreover, we show how the optimization is automated using our source-to-source compiler. We demonstrate the optimization of the element subroutines forFEM model using St.,Venant-Kirchhoff material. The performance of code generated by our compiler outperforms our previously published hand-tuned implementation by factor of 1.32 -- 1.54 depending on used GPU architecture. Although the optimization technique is demonstrated on element subroutines for using St.,Venant-Kirchhoff material, it is generally usable for wider area of computationally-demanding problems.

Klasifikace

Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—

Návaznosti výsledku

Projekt
<a href="/cs/project/GD102%2F09%2FH042" target="_blank" >GD102/09/H042: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach

Ostatní

Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název statě ve sborníku
Symposium on Application Accelerators in High Performance Computing
ISBN
9781467328821
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
141-144
Název nakladatele
IEEE
Místo vydání
LOS ALAMITOS, CA, USA
Místo konání akce
Argonne, IL, USA
Datum konání akce
1. 1. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000309942800019

Podobné výsledky(10)

GPU Acceleration of Equations Assembly in Finite Elements Method -- Preliminary Results Gradient polyconvex material models and their numerical treatment Rank 1 konvexita energií fyzikálně lineárních vztahů mezi napětím a deformací

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)