Implementation of hybrid total FETI (HTFETI) solver for multi-core architectures
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F15%3A86096105" target="_blank" >RIV/61989100:27240/15:86096105 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/61989100:27740/15:86096105 RIV/61989100:27230/15:86096105
Výsledek na webu
<a href="http://dx.doi.org/10.1063/1.4913028" target="_blank" >http://dx.doi.org/10.1063/1.4913028</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1063/1.4913028" target="_blank" >10.1063/1.4913028</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Implementation of hybrid total FETI (HTFETI) solver for multi-core architectures
Popis výsledku v původním jazyce
We describe the implementation and the performance and scalability results of a hybrid FETI (Finite Element Tearing and Interconnecting) solver based on our variant of the FETI type domain decomposition method called Total FETI. In our approach a small number of neighboring subdomains is aggregated into clusters, which results into a smaller coarse problem. To solve the original problem Total FETI method is applied twice: to the clusters and then to the subdomains in each cluster. Current implementationof the solver is focused on the performance optimization of the main CG iteration loop, including: implementation of communication hiding and avoiding techniques for global communications; optimization of the nearest neighbor communication - multiplication with global gluing matrix; and optimization of the parallel CG algorithm to iterate over local Lagrange multipliers only. The performance is demonstrated on a linear elasticity synthetic 3D cube and real world benchmarks.
Název v anglickém jazyce
Implementation of hybrid total FETI (HTFETI) solver for multi-core architectures
Popis výsledku anglicky
We describe the implementation and the performance and scalability results of a hybrid FETI (Finite Element Tearing and Interconnecting) solver based on our variant of the FETI type domain decomposition method called Total FETI. In our approach a small number of neighboring subdomains is aggregated into clusters, which results into a smaller coarse problem. To solve the original problem Total FETI method is applied twice: to the clusters and then to the subdomains in each cluster. Current implementationof the solver is focused on the performance optimization of the main CG iteration loop, including: implementation of communication hiding and avoiding techniques for global communications; optimization of the nearest neighbor communication - multiplication with global gluing matrix; and optimization of the parallel CG algorithm to iterate over local Lagrange multipliers only. The performance is demonstrated on a linear elasticity synthetic 3D cube and real world benchmarks.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BA - Obecná matematika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
AIP Conference Proceedings. Volume 1648
ISBN
978-0-7354-1287-3
ISSN
0094-243X
e-ISSN
—
Počet stran výsledku
4
Strana od-do
"nestrankovano"
Název nakladatele
American Institute of Physics
Místo vydání
New York
Místo konání akce
Rhodos
Datum konání akce
22. 9. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000355339705025