Virtual assistent for access to historical audiovisual data
Public support
Provider
Ministry of Culture
Programme
Programme for the Support of Applied Research and Exp. Development of National and Cultural Identity dor the Years 2016-2022 (in short, "NAKI II")
Call for proposals
NAKI II 1 (SMK02016DG001)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
19/2016/OVV
Alternative language
Project name in Czech
Virtuální asistent pro zpřístupnění historických audiovizuálních dat
Annotation in Czech
Navrhovaný projekt VIADAT je primárně zaměřen na vytváření metod (a souvisejících nástrojů, vesměs software) pro dokumentaci a prezentaci paměťové kultury národa, jak byla, je a bude zachycována na zvukových a audiovizuálních médiích. Projekt tedy spadá především do oblasti orální historie, vytvořené nástroje však budou umožňovat zpracování archivů audio- a videonahrávek pro následné zpřístupnění a využití jak ve vědeckém výzkumu, tak i ve vzdělávání. Budou přitom využity nejmodernější technologie a postupy pro uchování, lokální i dálkové zpřístupnění, prohledávání, extrakci a následné zpracování výstupů za podpory otevřených softwarových nástrojů. Hlavní roli přitom budou hrát jazykové technologie pro automatickou analýzu mluvené řeči a její následné zpracování automatickými metodami jazykové analýzy, neboť informační hodnota audionahrávek, případně audiovizuálních nahrávek vzpomínek pamětníků nejrůznějších událostí je především obsažena v tom, co na předmětných nahrávkách říkají. Následné zpracování pak bude podpořeno řadou softwarových nástrojů (modulů) pro studie vycházející z materiálů samotného a z jeho kvantitativních i kvalitativních charakteristik. Tyto nástroje umožní extrakci částí zdrojových nahrávek, jejich přepisů, grafů, tabulek a zajistí i vizualizaci kvantitativních výsledků. Tyto cíle budou naplněny vytvořením integrované softwarové platformy („virtuálního asistenta“) pro zpracování, anotace či obohacení („enrichment“) a zpřístupnění audio a videonahrávek. Předpokládáme i mezinárodní využití software vzhledem k jazykové nezávislosti řady plánovaných komponent. Tato platforma bude mít čtyři části: repozitář, systém pro zpřístupnění, software pro deponování nahrávek a software pro anotaci a exploataci nahrávek. Ověření funkčnosti všech součástí systému, včetně úprav podle zjištěných nedostatků, bude provedeno na dvou případových studiích ve spolupráci s partnery projektu.
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
AJ - Literature, mass media, audio-visual activities
CEP - secondary branch
AI - Linguistics
CEP - another secondary branch
IN - Informatics
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50801 - Journalism<br>50802 - Media and socio-cultural communication<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics<br>60204 - General literature studies<br>60205 - Literary theory<br>60206 - Specific literatures
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
Research and development of tools (especially software) for documentation and presentation of the memory culture of the nation as it was, is and will be captured on audio and audiovisual media was a goal of the project. The main goal has been achieved by creating an integrated software platform (“virtual assistant”) for processing, annotating or enrichment and making audio and video recordings available. Out of the 10 planned main project results, 9 were applied, one patent remained unpaid due to a change in the conditions for patenting software in the US during the solution.
Solution timeline
Realization period - beginning
Mar 1, 2016
Realization period - end
Dec 31, 2019
Project status
U - Finished project
Latest support payment
Mar 26, 2019
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP20-MK0-DG-U/03:1
Data delivery date
May 18, 2021
Finance
Total approved costs
16,433 thou. CZK
Public financial support
15,927 thou. CZK
Other public sources
532 thou. CZK
Non public and foreign sources
0 thou. CZK