Software module for automatic enhancement of digitized documents
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F19%3APR32695" target="_blank" >RIV/00216305:26230/19:PR32695 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.fit.vut.cz/research/product/630/" target="_blank" >https://www.fit.vut.cz/research/product/630/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Software module for automatic enhancement of digitized documents
Popis výsledku v původním jazyce
Tool for text-guided textual document scan quality enhancement. The method works on lines of text that can be input through a PAGE XML or detected automatically by a built-in OCR. By using text input along with the image, the results can be correctly readable even with parts of the original text missing or severely degraded in the source image. The tool includes functionality for cropping the text lines, processing them with our provided models for either text enhancement and inpainting, and for blending the enhanced text lines back into the source document image. We currently provide models for OCR and enhancement of czech newspapers optimized for low-quality scans from micro-films. This package can be used as a standalone command line tool to process document pages in bulk. Alternatively, the package provides a python class that can be integrated in third-party software.
Název v anglickém jazyce
Software module for automatic enhancement of digitized documents
Popis výsledku anglicky
Tool for text-guided textual document scan quality enhancement. The method works on lines of text that can be input through a PAGE XML or detected automatically by a built-in OCR. By using text input along with the image, the results can be correctly readable even with parts of the original text missing or severely degraded in the source image. The tool includes functionality for cropping the text lines, processing them with our provided models for either text enhancement and inpainting, and for blending the enhanced text lines back into the source document image. We currently provide models for OCR and enhancement of czech newspapers optimized for low-quality scans from micro-films. This package can be used as a standalone command line tool to process document pages in bulk. Alternatively, the package provides a python class that can be integrated in third-party software.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/DG18P02OVV055" target="_blank" >DG18P02OVV055: Pokročilá extrakce a rozpoznávání obsahu tištěných a rukou psaných digitalizátů pro zvýšení jejich přístupnosti a využitelnosti</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
PERO-ENHANCE
Technické parametry
Využití na základě volné a bezplatné open-source licence.
Ekonomické parametry
Jedná se o modul pro integraci do digitalizačních linek a digitalizačního software. Komerční uplatnění je možné v rámci poskytování doplňkových služeb a konzultací.
IČO vlastníka výsledku
—
Název vlastníka
Fakulta informačních technologií