Orbis Pictus – oživení knihy pro kulturní a kreativní odvětví
Cíle projektu
Fondy českých knihoven obsahují obrovské množství informací. Přesto, že dominují informace textové, významnou částí našeho kulturního dědictví jsou i informace zachycené graficky, ať už se jedná o kresby, mapy, schémata, grafy, fotografie, tabulky nebo jiné primárně grafické prvky. S postupující digitalizací se díky nasazení systémů OCR a fulltextového vyhledávání daří otevírat veřejnosti doposud skryté textové kulturní dědictví. Cílem předkládaného projektu je podobným způsobem otevřít veřejnosti i grafický obsah digitálních knihoven. S využitím metod strojového učení bude možné identifikovat grafické elementy obsažené v digitalizovaných dokumentech, typově je kategorizovat, doplnit o kontextové údaje umožňující jejich snadnější vyhledávání a rozšířit nabídku služeb našich digitálních knihoven o systém pro vyhledávání takto identifikovaných grafických prvků. Významnou součástí výstupů projektu bude i nástroj pro nalezení různých vyobrazení stejných osob a databáze takto nalezených osob, které se podaří identifikovat. Výsledkem projektu tak bude mimo jiné i významné usnadnění přístupu externích uživatelů ke grafickým prvkům obsaženým ve fondech knihoven a jejich dalšímu využití v jiných kreativních odvětvích.
Klíčová slova
digital librariesmachine learningimage identificationimage retrieval
Veřejná podpora
Poskytovatel
Ministerstvo kultury
Program
Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030
Veřejná soutěž
SMK02023DH001
Hlavní účastníci
Knihovna AV ČR, v. v. i.
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
033/2023/OVV
Alternativní jazyk
Název projektu anglicky
Orbis Pictus – book revival for cultural and creative sectors
Anotace anglicky
Collections of Czech libraries contain a vast amount of information. Despite the dominance of textual information, a significant part of our cultural heritage is also information captured graphically, be it drawings, maps, diagrams, graphs, photographs, tables or other primarily graphic elements. As digitisation progresses, the deployment of OCR and full-text search systems is opening up hitherto hidden textual cultural heritage to the public. The aim of the present project is to open the graphic content of digital libraries to the public in a similar way. Using machine learning methods, it will be possible to identify the graphic elements contained in digitized documents, to categorize them by type, to add contextual data to facilitate their retrieval and to extend the range of services of our digital libraries by a system for retrieving the graphic elements identified in this way. An important part of the project's outputs will be a tool for finding different images of the same persons and a database of identified persons. The project will thus result, among other things, in a significant facilitation of access by external users to graphic elements contained in library collections and their further use in other creative industries.
Vědní obory
Kategorie VaV
VV - Experimentální vývoj
OECD FORD - hlavní obor
50804 - Library science
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
60500 - Other Humanities and the Arts
CEP - odpovídající obory
(dle převodníku)AF - Dokumentace, knihovnictví, práce s informacemi
BC - Teorie a systémy řízení
BD - Teorie informace
IN - Informatika
Termíny řešení
Zahájení řešení
1. 3. 2023
Ukončení řešení
31. 12. 2027
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
16. 3. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-MK0-DH-R
Datum dodání záznamu
13. 2. 2025
Finance
Celkové uznané náklady
30 588 tis. Kč
Výše podpory ze státního rozpočtu
30 588 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
30 588 tis. Kč
Statní podpora
30 588 tis. Kč
100%
Poskytovatel
Ministerstvo kultury
OECD FORD
Library science
Doba řešení
01. 03. 2023 - 31. 12. 2027