KLN: a deep neural network architecture for keypoint localization
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61988987%3A17610%2F20%3AA21024FM" target="_blank" >RIV/61988987:17610/20:A21024FM - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/9204211" target="_blank" >https://ieeexplore.ieee.org/document/9204211</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/DSMP47368.2020.9204211" target="_blank" >10.1109/DSMP47368.2020.9204211</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
KLN: a deep neural network architecture for keypoint localization
Popis výsledku v původním jazyce
Pixel-precision level localization of keypoints is an essential step for stitching panoramic images as these keypoints are matching, and their locations are used for computing stitching transformation. We recall the main standard computer vision techniques for keypoint localization and focus on the precise localization. Based on the SIFT technique, we design a neural network architecture containing an encoder, a latent representation handler, and a decoder. In contrast to domain-agnostic neural network architectures, the developed encoder reflects the scale-space construction as well as the difference of Gaussians estimation used in SIFT. In the benchmark, we show that our architecture has a higher number of keypoints localized with pixel precision considering flips, intensity changes, and blurrings than other standard and neural network-based approaches.
Název v anglickém jazyce
KLN: a deep neural network architecture for keypoint localization
Popis výsledku anglicky
Pixel-precision level localization of keypoints is an essential step for stitching panoramic images as these keypoints are matching, and their locations are used for computing stitching transformation. We recall the main standard computer vision techniques for keypoint localization and focus on the precise localization. Based on the SIFT technique, we design a neural network architecture containing an encoder, a latent representation handler, and a decoder. In contrast to domain-agnostic neural network architectures, the developed encoder reflects the scale-space construction as well as the difference of Gaussians estimation used in SIFT. In the benchmark, we show that our architecture has a higher number of keypoints localized with pixel precision considering flips, intensity changes, and blurrings than other standard and neural network-based approaches.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10102 - Applied mathematics
Návaznosti výsledku
Projekt
<a href="/cs/project/EF17_049%2F0008414" target="_blank" >EF17_049/0008414: Centrum pro výzkum a vývoj metod umělé intelligence v automobilovém průmyslu regionu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of IEEE Third International Conference Data Stream Mining & Processing 2020
ISBN
978-1-7281-3215-0
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
—
Název nakladatele
IEEE
Místo vydání
Lvov, Ukraina
Místo konání akce
Lvov, Ukraina
Datum konání akce
21. 8. 2020
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—