OpenCL Kernel Fusion for GPU, Xeon Phi and CPU
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F15%3A00083464" target="_blank" >RIV/00216224:14330/15:00083464 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1109/SBAC-PAD.2015.29" target="_blank" >http://dx.doi.org/10.1109/SBAC-PAD.2015.29</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/SBAC-PAD.2015.29" target="_blank" >10.1109/SBAC-PAD.2015.29</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
OpenCL Kernel Fusion for GPU, Xeon Phi and CPU
Popis výsledku v původním jazyce
Kernel fusion is an optimization method, in which the code from several kernels is composed to create a new, fused kernel. It can push the performance of kernels beyond limits given for their isolated, unfused form. In this paper, we introduce a classification of different types of kernel fusion for both data dependent and data independent kernels. We study kernel fusion on three types of OpenCL devices: GPU, Xeon Phi and CPU. Those hardware platforms have quite different properties, thus, kernel fusionoften affects performance in quite different ways. We analyze the impact of kernel fusion on those hardware platforms and show how it can be used to improve performance. Based on our study we also introduce a basic transformation method for generating fused kernels, which has good potential to be automatized.
Název v anglickém jazyce
OpenCL Kernel Fusion for GPU, Xeon Phi and CPU
Popis výsledku anglicky
Kernel fusion is an optimization method, in which the code from several kernels is composed to create a new, fused kernel. It can push the performance of kernels beyond limits given for their isolated, unfused form. In this paper, we introduce a classification of different types of kernel fusion for both data dependent and data independent kernels. We study kernel fusion on three types of OpenCL devices: GPU, Xeon Phi and CPU. Those hardware platforms have quite different properties, thus, kernel fusionoften affects performance in quite different ways. We analyze the impact of kernel fusion on those hardware platforms and show how it can be used to improve performance. Based on our study we also introduce a basic transformation method for generating fused kernels, which has good potential to be automatized.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/EE2.3.30.0037" target="_blank" >EE2.3.30.0037: Zaměstnáním nejlepších mladých vědců k rozvoji mezinárodní spolupráce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of IEEE International Symposium on Computer Architecture and High Performance Computing
ISBN
—
ISSN
1550-6533
e-ISSN
—
Počet stran výsledku
8
Strana od-do
98-105
Název nakladatele
IEEE
Místo vydání
Florianópolis
Místo konání akce
Florianópolis, Brazil
Datum konání akce
1. 1. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—