Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)
Veřejná podpora
Poskytovatel
Ministerstvo kultury
Program
Program aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI)
Veřejná soutěž
NAKI 2 (SMK02012DF001)
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta<br>Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
22/2012/OVV
Alternativní jazyk
Název projektu anglicky
ASR- and MT-based Access to a Large Archive of Cultural Heritage (AMALACH)
Anotace anglicky
The objective of the project is build software tools for end-user access to a large videoarchive of Holocaust survivors testimonies. This archive, created in the 1990s and currently maintained by the Visual History Institute (Shoa Foundation Institute) at the University of Southern California (USC, http://dornsife.usc.edu/vhi). The archive is currently accessible only at the MFF UK building in Prague and two more places in Europee. It contains more than 110 thousand hours of interview in 32 languages, about half of them in English. There are about 1,000 hours of testimonies recorded in Czech. Searching such a large videoarchive is thus very difficult without proper search software. At present, thesaurus-only keyword search based on sparse, manually created index is possible. The situation is even worse for non-English testimonies, such as those recorded in Czech. Our goal is thus to combine and apply advanced continuous speech recognition, speech retrieval and machine translation methods to allow fora precise, fast and targeted search in the USC archive s (at least) Czech and English testimonies, in a cross-lingual manner; Slovak (another 1000 hours) will be added if possible. The cross-lingual capability over the English testimonies will make it possible for Czech users to access in a unified way the additional 4000 testimonies given by Czechs but recorded in English, and there are another 12 thousand where the Czech territory, historical events related to former Czechoslovakia and people from theregion are mentioned.
Vědní obory
Kategorie VaV
AP - Aplikovaný výzkum
CEP - hlavní obor
AJ - Písemnictví, mas–media, audiovize
CEP - vedlejší obor
AI - Jazykověda
CEP - další vedlejší obor
IN - Informatika
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50801 - Journalism<br>50802 - Media and socio-cultural communication<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics<br>60204 - General literature studies<br>60205 - Literary theory<br>60206 - Specific literatures
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Projekt splnil hlavní cíle i dílčí cíle a uspěl podle zadání. Periodické zprávy projektu byly RMKPV kladně hodnoceny.
Termíny řešení
Zahájení řešení
1. 3. 2012
Ukončení řešení
31. 12. 2015
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
26. 3. 2015
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP16-MK0-DF-U/02:1
Datum dodání záznamu
14. 12. 2016
Finance
Celkové uznané náklady
19 152 tis. Kč
Výše podpory ze státního rozpočtu
19 000 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč