Rank-Reducing Two-Dimensional Grammars for Document Layout Analysis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F18%3A00327634" target="_blank" >RIV/68407700:21230/18:00327634 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/8270116" target="_blank" >https://ieeexplore.ieee.org/document/8270116</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ICDAR.2017.185" target="_blank" >10.1109/ICDAR.2017.185</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Rank-Reducing Two-Dimensional Grammars for Document Layout Analysis
Popis výsledku v původním jazyce
We study the task of document layout analysis based on two-dimensional context-free grammars. We first identify a subclass of the grammars sufficient for a document structure description where productions follow a mechanism inducing regular languages in the case of one-dimensional productions. We then show that properties of such grammars can be conveniently utilized to implement a very fast top-down parser. Experimental results are reported for PDF documents, which are chosen as a test domain since we are motivated by a development of digital document access methods for people with disabilities in which a retrieval of structural information plays an important role.
Název v anglickém jazyce
Rank-Reducing Two-Dimensional Grammars for Document Layout Analysis
Popis výsledku anglicky
We study the task of document layout analysis based on two-dimensional context-free grammars. We first identify a subclass of the grammars sufficient for a document structure description where productions follow a mechanism inducing regular languages in the case of one-dimensional productions. We then show that properties of such grammars can be conveniently utilized to implement a very fast top-down parser. Experimental results are reported for PDF documents, which are chosen as a test domain since we are motivated by a development of digital document access methods for people with disabilities in which a retrieval of structural information plays an important role.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-05872S" target="_blank" >GA16-05872S: Pravděpodobnostní grafové modely a hluboké učení</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
14th IAPR International Conference on Document Analysis and Recognition (ICDAR)
ISBN
978-1-5386-3586-5
ISSN
—
e-ISSN
1520-5363
Počet stran výsledku
6
Strana od-do
1120-1125
Název nakladatele
IEEE Computer Society
Místo vydání
Los Alamitos
Místo konání akce
Kyoto
Datum konání akce
9. 11. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—