Smart digiline - machine learning for digitization of printed heritage
Public support
Provider
Ministry of Culture
Programme
—
Call for proposals
SMK02023DH001
Main participants
Knihovna AV ČR, v. v. i.
Contest type
VS - Public tender
Contract ID
066/2023/OVV
Alternative language
Project name in Czech
Smart digilinka – strojové učení pro digitalizaci tištěného dědictví
Annotation in Czech
České knihovny mají rozsáhlé fondy monografií a periodik, které postupně podléhají zkáze opotřebením a rozpadem papíru, na kterém jsou vytištěny. Přes intenzivní snahy o záchranu tištěných originálů restaurátorskými postupy je klíčovým nástrojem pro záchranu kulturního dědictví a informací v nich obsažených digitalizace, která výrazně snižuje mechanické opotřebení originálů a zároveň otevírá jejich informační obsah široké veřejnosti. Kapacita digitalizačních linek v jednotlivých knihovnách je však limitovaná především manuální náročností digitalizačního procesu, a i proto je ročně v knihovnách digitalizováno v souhrnu menší množství stran, než jich do fondů knihoven přibývá. Řada starších dokumentů tak postupně podléhá zkáze. V mnoha případech jsou už uživatelům některé dokumenty zcela znepřístupněny z důvodu jejich ochrany před úplným rozpadem. Cílem předkládaného projektu je vývoj nástrojů využívajících strojového učení v procesu digitalizace a vytvoření poloprovozu digitalizační linky tak, aby se tento proces výrazně zefektivnil a bylo z něj odstraněno co nejvíce činností, které může zajistit moderní software. Poloprovoz bude kombinovat existující nástroje s nástroji vyvinutými speciálně pro potřeby digitalizačních center knihoven. Výsledek projektu bude použitelný na digitalizačních pracovištích velkých českých i zahraničních knihoven, a to v podobě samostatné instalace nebo na dálku využívané služby poskytované Národní knihovnou ČR nebo jinou institucí. Jedná se zejména o softwarové nástroje a metodiky pro vyrovnání a scelování nasnímaných předloh a nástroje podporující strojovou tvorbu strukturálních metadat.
Scientific branches
R&D category
VV - Exeperimental development
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
50804 - Library science
OECD FORD - another secondary branch
60500 - Other Humanities and the Arts
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics
Solution timeline
Realization period - beginning
Mar 1, 2023
Realization period - end
Dec 31, 2027
Project status
B - Running multi-year project
Latest support payment
Mar 16, 2023
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP25-MK0-DH-R
Data delivery date
Feb 13, 2025
Finance
Total approved costs
36,443 thou. CZK
Public financial support
36,443 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK