Historické prameny na dosah. Zpřístupnění středověkých písemných dokumentů formou kontextuální databáze
Cíle projektu
Základním cílem projektu je zpřístupnit písemné prameny k českým středověkým dějinám širokému okruhu uživatelů internetu: vědcům, pracovníkům paměťových institucí, učitelům, studentům i nejširší veřejnosti. Projekt využije digitalizovaných dat portálu Czech medieval sources online, která budou převedena do nově implementovaného systému AHISTO. Ten propojí dosavadní obrazová data se semiautomaticky vytvářenou textovou databází a umožní plnotextové sémantické prohledávání textů i metadat, tvorbu pokročilých anotací a extrakci strukturních dat. Vzhledem k rozsahu textového korpusu byl pro zpracování metadat zvolen testovací vzorek v podobě úředních písemností z husitské epochy (1419–1436).
Klíčová slova
OCRnamed entity recognitionhistorical documents portalfull-text semantic searchdigital editionsHussite perioddiplomatic sources
Veřejná podpora
Poskytovatel
Technologická agentura ČR
Program
Program na podporu aplikovaného společenskovědního a humanitního výzkumu, experimentálního vývoje a inovací ÉTA
Veřejná soutěž
ÉTA 3 (STA02019TL030)
Hlavní účastníci
Filosofický ústav AV ČR, v. v. i.
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
TL03000365 - Smlouva o poskytnutí podpory
Alternativní jazyk
Název projektu anglicky
Accessible historical sources. Making medieval written documents available in the form of a contextual database
Anotace anglicky
The main goal of the project is to make the written sources of Czech medieval history accessible for a wide range of internet users: researchers, employees of memory institutions, teachers, students, as well as the broader public. The project will use digitised data from the “Czech Medieval Sources Online” portal, which will be moved to the new “AHISTO” system. This system will connect image data with a semi-automatically created text database that will allow for fulltext semantic searches of content and metadata, the creation of advanced annotations, and structured data extractions. The overall corpus size limits the first data batch to the diplomatic material from the Hussite period (1419–1436).
Vědní obory
Kategorie VaV
AP - Aplikovaný výzkum
OECD FORD - hlavní obor
60101 - History (history of science and technology to be 6.3, history of specific sciences to be under the respective headings)
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory
(dle převodníku)AB - Dějiny
AF - Dokumentace, knihovnictví, práce s informacemi
BC - Teorie a systémy řízení
BD - Teorie informace
IN - Informatika
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Projekt bezpochyby přispěl k naplnění cílů programu ÉTA, v první řadě propojením expertních týmů historických a informačních věd. Téma digitalizace historických pramenů bylo velmi vhodně uchopeno a zasazeno do kontextu reakce na řešení společenských výzev. Ukončený projekt vykazuje vysokou míru uplatnitelnosti v rámci SHUV, přináší inovativní způsob přístupu k digitalizaci archivů a dosahuje požadované míry aplikovatelnosti výstupů. Dosažené výsledky lze z hlediska inovativnosti řešení považovat za vysoce relevantní, po obsahové i metodologické stránce je projekt jedinečným. Metodologický přístup zároveň vhodně využil synergii historie a informatiky k dosažení deklarovaných cílů a přínosů. Dosažené výsledky hodnotí oponentní komise jako vynikající.
Termíny řešení
Zahájení řešení
1. 5. 2020
Ukončení řešení
30. 4. 2023
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
28. 2. 2023
Dodání dat do CEP
Důvěrnost údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Systémové označení dodávky dat
CEP24-TA0-TL-U
Datum dodání záznamu
28. 6. 2024
Finance
Celkové uznané náklady
11 956 tis. Kč
Výše podpory ze státního rozpočtu
9 457 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
2 403 tis. Kč
Základní informace
Uznané náklady
11 956 tis. Kč
Statní podpora
9 457 tis. Kč
79%
Poskytovatel
Technologická agentura ČR
OECD FORD
History (history of science and technology to be 6.3, history of specific sciences to be under the respective headings)
Doba řešení
01. 05. 2020 - 30. 04. 2023