Standardy pro zachycení výsledků rozpoznání textu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00094943%3A_____%2F23%3AN0000027" target="_blank" >RIV/00094943:_____/23:N0000027 - isvavai.cz</a>
Výsledek na webu
<a href="https://itlib.cvtisr.sk/clanky/standardy-pro-zachyceni-vysledku-rozpoznani-textu/" target="_blank" >https://itlib.cvtisr.sk/clanky/standardy-pro-zachyceni-vysledku-rozpoznani-textu/</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.52036/1335793X.2023.SC2.63-74" target="_blank" >10.52036/1335793X.2023.SC2.63-74</a>
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Standardy pro zachycení výsledků rozpoznání textu
Popis výsledku v původním jazyce
Článek se zaměřuje na standardy pro ukládání výsledků rozpoznání tištěného (OCR), popř. rukopisného (HTR) textu. Srovnává několik aktuálně používaných formátů na bázi značkovacího jazyka XML i JSON. Hlavní pozornost se soustředí na zachycení údajů o rozpoznaném jazyce, toku textu na stránce a mezi stránkami, včetně problematiky dělení slov na konci řádku.
Název v anglickém jazyce
Standards for Text Recognition Results
Popis výsledku anglicky
The paper focuses on standards for storing the results of Optical Character Recognition (OCR) and Handwritten Text Recognition (HTR). It compares several formats currently in use, based on XML and the JSON markup language. The focus is on capturing information about the language recognized, the flow of text on a page and between pages, including word splitting at the end of a line.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
60201 - General language studies
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
ITlib. Informačné technológie a knižnice
ISSN
1336-0779
e-ISSN
—
Svazek periodika
2023
Číslo periodika v rámci svazku
speciální číslo 2
Stát vydavatele periodika
SK - Slovenská republika
Počet stran výsledku
12
Strana od-do
63–74
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—