Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Standardy pro zachycení výsledků rozpoznání textu

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00094943%3A_____%2F23%3AN0000027" target="_blank" >RIV/00094943:_____/23:N0000027 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://itlib.cvtisr.sk/clanky/standardy-pro-zachyceni-vysledku-rozpoznani-textu/" target="_blank" >https://itlib.cvtisr.sk/clanky/standardy-pro-zachyceni-vysledku-rozpoznani-textu/</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.52036/1335793X.2023.SC2.63-74" target="_blank" >10.52036/1335793X.2023.SC2.63-74</a>

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Standardy pro zachycení výsledků rozpoznání textu

  • Popis výsledku v původním jazyce

    Článek se zaměřuje na standardy pro ukládání výsledků rozpoznání tištěného (OCR), popř. rukopisného (HTR) textu. Srovnává několik aktuálně používaných formátů na bázi značkovacího jazyka XML i JSON. Hlavní pozornost se soustředí na zachycení údajů o rozpoznaném jazyce, toku textu na stránce a mezi stránkami, včetně problematiky dělení slov na konci řádku.

  • Název v anglickém jazyce

    Standards for Text Recognition Results

  • Popis výsledku anglicky

    The paper focuses on standards for storing the results of Optical Character Recognition (OCR) and Handwritten Text Recognition (HTR). It compares several formats currently in use, based on XML and the JSON markup language. The focus is on capturing information about the language recognized, the flow of text on a page and between pages, including word splitting at the end of a line.

Klasifikace

  • Druh

    J<sub>ost</sub> - Ostatní články v recenzovaných periodicích

  • CEP obor

  • OECD FORD obor

    60201 - General language studies

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2023

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    ITlib. Informačné technológie a knižnice

  • ISSN

    1336-0779

  • e-ISSN

  • Svazek periodika

    2023

  • Číslo periodika v rámci svazku

    speciální číslo 2

  • Stát vydavatele periodika

    SK - Slovenská republika

  • Počet stran výsledku

    12

  • Strana od-do

    63–74

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus