A parallel space-time boundary element method for the heat equation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F19%3A10240355" target="_blank" >RIV/61989100:27240/19:10240355 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/61989100:27740/19:10240355
Výsledek na webu
<a href="https://www.sciencedirect.com/science/article/pii/S0898122118307296?via%3Dihub" target="_blank" >https://www.sciencedirect.com/science/article/pii/S0898122118307296?via%3Dihub</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1016/j.camwa.2018.12.031" target="_blank" >10.1016/j.camwa.2018.12.031</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A parallel space-time boundary element method for the heat equation
Popis výsledku v původním jazyce
In this paper we introduce a new parallel solver for the weakly singular space-time boundary integral equation for the heat equation. The space-time boundary mesh is decomposed into a given number of submeshes. Pairs of the submeshes represent dense blocks in the system matrices, which are distributed among computational nodes by an algorithm based on a cyclic decomposition of complete graphs ensuring load balance. In addition, we employ vectorization and threading in shared memory to ensure intra-node efficiency. We present scalability experiments on different CPU architectures to evaluate the performance of the proposed parallelization techniques. All levels of parallelism allow us to tackle large problems and lead to an almost optimal speedup.
Název v anglickém jazyce
A parallel space-time boundary element method for the heat equation
Popis výsledku anglicky
In this paper we introduce a new parallel solver for the weakly singular space-time boundary integral equation for the heat equation. The space-time boundary mesh is decomposed into a given number of submeshes. Pairs of the submeshes represent dense blocks in the system matrices, which are distributed among computational nodes by an algorithm based on a cyclic decomposition of complete graphs ensuring load balance. In addition, we employ vectorization and threading in shared memory to ensure intra-node efficiency. We present scalability experiments on different CPU architectures to evaluate the performance of the proposed parallelization techniques. All levels of parallelism allow us to tackle large problems and lead to an almost optimal speedup.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10102 - Applied mathematics
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Computers & Mathematics with Applications
ISSN
0898-1221
e-ISSN
—
Svazek periodika
78
Číslo periodika v rámci svazku
9
Stát vydavatele periodika
GB - Spojené království Velké Británie a Severního Irska
Počet stran výsledku
15
Strana od-do
2852-2866
Kód UT WoS článku
000491624900002
EID výsledku v databázi Scopus
2-s2.0-85059669009