Historical Map Toponym Extraction for Efficient Information Retrieval
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F22%3A43965496" target="_blank" >RIV/49777513:23520/22:43965496 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.scopus.com/record/display.uri?eid=2-s2.0-85131115206&origin=resultslist&sort=plf-f" target="_blank" >https://www.scopus.com/record/display.uri?eid=2-s2.0-85131115206&origin=resultslist&sort=plf-f</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-031-06555-2_12" target="_blank" >10.1007/978-3-031-06555-2_12</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Historical Map Toponym Extraction for Efficient Information Retrieval
Popis výsledku v původním jazyce
The paper deals with detection, classification and recognition of toponyms in hand-drawn historical cadastral maps. Toponyms are local names of towns, villages and landscape features such as rivers, forests etc. The detected and recognized toponyms are utilized as keywords in an information retrieval system that allows intelligent and efficient searching in historical map collections. We create a novel annotated dataset that is freely available for research and educational purposes. Then, we propose a novel approach for toponym classification based on KAZE descriptor. Next we compare and evaluate several state-of-the-art methods for text and object detection on our toponym detection task. We further show the results of toponym text recognition using popular Tesseract engine.
Název v anglickém jazyce
Historical Map Toponym Extraction for Efficient Information Retrieval
Popis výsledku anglicky
The paper deals with detection, classification and recognition of toponyms in hand-drawn historical cadastral maps. Toponyms are local names of towns, villages and landscape features such as rivers, forests etc. The detected and recognized toponyms are utilized as keywords in an information retrieval system that allows intelligent and efficient searching in historical map collections. We create a novel annotated dataset that is freely available for research and educational purposes. Then, we propose a novel approach for toponym classification based on KAZE descriptor. Next we compare and evaluate several state-of-the-art methods for text and object detection on our toponym detection task. We further show the results of toponym text recognition using popular Tesseract engine.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/EF17_048%2F0007267" target="_blank" >EF17_048/0007267: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblast</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Document Analysis Systems : 15th IAPR International Workshop on Document Analysis Systems, DAS 2022
ISBN
978-3-031-06554-5
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
13
Strana od-do
171-183
Název nakladatele
Springer
Místo vydání
Cham
Místo konání akce
La Rochelle, France
Datum konání akce
22. 5. 2022
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000870314500012