Towards Visual Words to Words Text Detection with a General Bag of Words Representation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F15%3A00236244" target="_blank" >RIV/68407700:21230/15:00236244 - isvavai.cz</a>
Výsledek na webu
<a href="http://cmp.felk.cvut.cz/~chum/papers/Mehta-ICDAR2015.pdf" target="_blank" >http://cmp.felk.cvut.cz/~chum/papers/Mehta-ICDAR2015.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ICDAR.2015.7333840" target="_blank" >10.1109/ICDAR.2015.7333840</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Towards Visual Words to Words Text Detection with a General Bag of Words Representation
Popis výsledku v původním jazyce
We address the problem of text localization and retrieval in real world images. We are first to study the retrieval of text images, i.e. the selection of images containing text in large collections at high speed. We propose a novel representation, textual visual words, which describe text by generic visual words that geometrically consistently predict bottom and top lines of text. The visual words are discretized SIFT descriptors of Hessian features. The features may correspond to various structures present in the text - character fragments, individual characters or their arrangements. The textual words representation is invariant to affine transformation of the image and local linear change of intensity. Experiments demonstrate that the proposed method outperforms the state-of-the-art on the MS dataset. The proposed method detects blurry, small font, low contrast, noisy text from real world images.
Název v anglickém jazyce
Towards Visual Words to Words Text Detection with a General Bag of Words Representation
Popis výsledku anglicky
We address the problem of text localization and retrieval in real world images. We are first to study the retrieval of text images, i.e. the selection of images containing text in large collections at high speed. We propose a novel representation, textual visual words, which describe text by generic visual words that geometrically consistently predict bottom and top lines of text. The visual words are discretized SIFT descriptors of Hessian features. The features may correspond to various structures present in the text - character fragments, individual characters or their arrangements. The textual words representation is invariant to affine transformation of the image and local linear change of intensity. Experiments demonstrate that the proposed method outperforms the state-of-the-art on the MS dataset. The proposed method detects blurry, small font, low contrast, noisy text from real world images.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Document Analysis and Recognition (ICDAR), 2015 13th International Conference on
ISBN
978-1-4799-1805-8
ISSN
1520-5363
e-ISSN
—
Počet stran výsledku
5
Strana od-do
641-645
Název nakladatele
IEEE
Místo vydání
Piscataway
Místo konání akce
Nancy
Datum konání akce
23. 8. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000381461400127