Recognition Of Text With Known Geometric And Grammatical Structure
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F08%3A03141929" target="_blank" >RIV/68407700:21230/08:03141929 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Recognition Of Text With Known Geometric And Grammatical Structure
Original language description
The optical character recognition (OCR) module is a fundamental part of each automated text processing system. The OCR module translates an input image with a text line into a string of symbols. In many applications (e.g. license plate recognition) the text has some a priori known geometric and grammatical structure. This article proposes an OCR method exploiting this knowledge which restricts the set of possible strings to a limited set of feasible combinations. The recognition task is formulated as maximization of a similarity function which uses character templates as reference. These templates are estimated by a support vector machine method from a set of examples. In contrast to the common approach, the proposed method performs character segmentation and recognition simultaneously. The method was successfully evaluated in a car license plate recognition system.
Czech name
Rozpoznávání textu se známou geometrickou a gramatickou strukturou
Czech description
Modul pro optické rozpoznávání znaků (OCR) je neodmyslitelnou součástí každého systému pro automatické zpracování textu. OCR modul převádí vstupní obrázek obsahující řádku textu na řetězec symbolů. V mnoha aplikacích (např. rozpoznávání registračních značek) má text a priori známou geometrickou a gramatickou strukturu. Tento článek popisuje metodu OCR, která využívá této znalosti k zúžení množiny možných řetězců na omezenou množinu dosažitelných kombinací. Úloha rozpoznávání je formulována jako maximalizace podobnostní funkce, která používá šablony jednotlivých znaků jako referenci. Tyto šablony se odhadují ze sady příkladů pomocí metody SVM. Oproti běžnému přístupu provádí navrhovaná metoda segmentaci a rozpoznávání znaků současně. Metoda byla úspěšnětestována jako součást systému pro rozpoznávání registračních značek.
Classification
Type
D - Article in proceedings
CEP classification
BB - Applied statistics, operational research
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
VISAPP 2008: Proceedings of the Third International Conference on Computer Vision Theory and Applications
ISBN
978-989-8111-21-0
ISSN
—
e-ISSN
—
Number of pages
6
Pages from-to
—
Publisher name
INSTICC Press
Place of publication
Setúbal
Event location
Funchal, Madeira
Event date
Jan 22, 2008
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
000256791600032