Optimalization of digitalization tools for printed documents endangered by acid paper deterioration
Public support
Provider
Ministry of Culture
Programme
Protecting cultural, artistic and scientific resources and making them accessible
Call for proposals
Zpřístupnění a ochrana kulturních, uměleckých a vědeckých zdrojů 1 (SMK0200600002)
Main participants
—
Contest type
VS - Public tender
Contract ID
9/2006/OUK
Alternative language
Project name in Czech
Optimalizace nástrojů pro digitalizaci tištěných dokumentů ohrožených degradací kyselého papíru
Annotation in Czech
1. Vybudování znalostní báze založené na slovnících a frazeologických bázích pro časové jazykové vrstvy z období let 1800 až 1989. Využití znalostní báze pro optimalizaci OCR u programového nástroje pro tvorbu dokumentů Sírius, používaného pro digitalizaci dokumentů v rámci Národního programu Kramerius. 2. Zvýšení produktivity systému Sírius a rozšíření popisu digitálních objektů zejména v oblasti jejich vnitřních částí (článků v časopisech a novinách, kapitol v monografiích) se zaměřením na automatizaci pořizování těchto metadat. Vytvoření nástroje pro převod interního informačního aparátu dokumentů (obsahy, rejstříky, poznámky apod.) do textové podoby. 3. Vytvoření editačního a konverzního nástroje na tvorbu metadat pro digitální objekty rozšířením funkcionality externího modulu Systému Kramerius o možnost přejímat a využívat data (zejména bibliografické záznamy) vytvořená v jiných systémech (např. knihovních).
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
AF - Documentation, librarianship, work with information
CEP - secondary branch
IN - Informatics
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The METS container format has been implemented in the Kramerius digital library. The project resulted in the creation of programme tools for optimizing the outcomes of OCR and automated generation of extended metadata. This enables a more effective and precise processing of the content of digitized Czech texts from the 1800-1989 period, available at: http://kramerius-info.nkp.cz.
Solution timeline
Realization period - beginning
Mar 1, 2006
Realization period - end
Dec 31, 2010
Project status
U - Finished project
Latest support payment
Apr 16, 2010
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP11-MK0-DC-U/01:1
Data delivery date
Jun 30, 2011
Finance
Total approved costs
5,165 thou. CZK
Public financial support
5,165 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK