System for permanent preservation of documentation and presentation of historical sources from the period of totalitarian regimes
Public support
Provider
Ministry of Culture
Programme
Programme for the Support of Applied Research and Exp. Development of National and Cultural Identity dor the Years 2016-2022 (in short, "NAKI II")
Call for proposals
NAKI II 1 (SMK02016DG001)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta<br>Ústav pro studium totalitních režimů<br>Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Contest type
VS - Public tender
Contract ID
48/2016/OVV
Alternative language
Project name in Czech
Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimů
Annotation in Czech
Hlavním cílem navrhovaného projektu je výzkum a vývoj softwarových nástrojů pro trvalé uchování a zpřístupnění historických pramenů získaných v rámci dokumentační činnosti Ústavu pro studium totalitních režimů (dále ÚSTR). Cílem projektu je vytvořit nástroj pro integrovaný archiv nahrávek, dokumentů a fotografií přístupný online a prohledávatelný podle různých aspektů (konkrétní obsah nahrávek, jméno a ostatní životopisné údaje pamětníka, časové období, ke kterému se dokument vztahuje, apod.). Pro tyto účely použijeme především automatické rozpoznávání mluvené řeči, automatickou indexaci a vyhledávání v rozpoznaných nahrávkách a částečně také strojové rozpoznávání znaků (OCR) a navazující techniky zpracování přirozeného jazyka. Využijeme též zkušenosti získané při vývoji repozitářového softwaru určeného pro ukládání a zpřístupnění velkého množství různorodých jazykových dat. V rámci projektu bude pro účely předvedení a ověření funkčnosti vyvinutých softwarových nástrojů zpracováno minimálně 1000 hodin záznamu audionahrávek rozhovorů a výpovědí, které vznikly v rámci dokumentační činnosti ÚSTR v rozmezí let 2008 až 2015 a 50 000 textových a obrazových dokumentů. Audionahrávky obsahují bilanční rozhovory s pamětníky totalitních režimů v Československu; ostatní dokumenty jsou kopie souvisejících listin, dokladů a fotografií z domácích archivů a dalších zdrojů. Vyvinuté nástroje nicméně budou použitelné i pro zpracování a zpřístupnění dalších nahrávek a dokumentů podobného typu.
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
AF - Documentation, librarianship, work with information
CEP - secondary branch
AJ - Literature, mass media, audio-visual activities
CEP - another secondary branch
IN - Informatics
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50801 - Journalism<br>50802 - Media and socio-cultural communication<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60204 - General literature studies<br>60205 - Literary theory<br>60206 - Specific literatures
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
Main goal of this project was to develop software tools that would help the public to access extensive archive of oral history documents and recordings. 2 software were created; ALIGN for automatic matching of recordings with transcripts and HIDOAR – ultimate web archive. Integrated archive of recordings, documents and photos can be searched according to different criteria, is online and enables searching of audio recordings and documents. Archive has better user interface than expected. 2 out of 2 main results were achieved and 10 out of 9 planned secondary results were achieved. Project is thus evaluated as „Successful“.
Solution timeline
Realization period - beginning
Mar 1, 2016
Realization period - end
Dec 31, 2019
Project status
U - Finished project
Latest support payment
Mar 26, 2019
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP20-MK0-DG-U/03:1
Data delivery date
May 18, 2021
Finance
Total approved costs
14,444 thou. CZK
Public financial support
14,405 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK