Disclosure of the Czech Radio archive for sophisticated search
Public support
Provider
Ministry of Culture
Programme
Applied research and development of national and cultural identity Programme? (in short, ?NAKI?)
Call for proposals
NAKI 1 (SMK02011DF001)
Main participants
—
Contest type
VS - Public tender
Contract ID
13/2011/OVV
Alternative language
Project name in Czech
Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání
Annotation in Czech
Archiv mluvených pořadů Českého rozhlasu je právem označován za jeden z klenotů kul-turního dědictví ČR.Obsahuje totiž nejrozsáhlejší sbírku záznamů mluvené češtiny, unikátní svým objemem (v řádu stovek tisíc hodin nahrávek), obsahem (dennodenní komentáře k domácím i světovým událostem) i časovým rozpětím (více než 80 let nepřetržitého vysílání). Prvním krokem záchrany tohoto archivu je právě probíhající digitalizace. Druhým krokem by mělo být jeho zpřístupnění pomocí nejmodernějších technologií. To jecílem to-hoto projektu, jehož výsledkem bude zpracování významné části archivu (zejména zpra-vodajských a publicistických pořadů) metodami počítačového přepisu řeči, uložení těchto přepisů doplněných o řadu detailních informací do databáze a umožnění neomezeného vyhledávání v této databázi způsobem obdobným jako u textových dokumentů (tzv. full-text search). Vytvořením komplexní softwarové technologie, zahrnující moduly zpracování audiosignálu archivních nahrávek, rozpoznávání řeči a řečníka, zaindexování přepisů do databáze, editoru a webového přehrávače, vznikne veřejně přístupný portál, který umožní nalezení libovolného slova či slovního spojení v archivu obsahujícím až stovky tisíc hodin záznamů, a to během zlomku sekundy. Uživateli této unikátní technologie budou jak pra-covníci Českého rozhlasu, jimž významným způsobem usnadní redakční práci, tak i histo-rici, kteří tímto způsobem získají okamžitý a interaktivní přístup k archivním pramenům, jazykovědci, pro něž bude takto zpřístupněný archiv zdrojem pro studie týkající se vývoje různých aspektů českého jazyka za posledních 80 let, a v neposlední řadě i vzdělávací instituce a široká veřejnost. Projekt je navržen s ohledem na budoucí udržitelnost, tj. vyvi-nuté technologie budou připraveny stejným způsobem zpracovávat všechny současné i budoucí pořady a průběžně tak doplňovat a aktualizovat obsah tohoto unikátního multime-diálního archivu.
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
AF - Documentation, librarianship, work with information
CEP - secondary branch
AJ - Literature, mass media, audio-visual activities
CEP - another secondary branch
JC - Computer hardware and software
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20206 - Computer hardware and architecture<br>50801 - Journalism<br>50802 - Media and socio-cultural communication<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60204 - General literature studies<br>60205 - Literary theory<br>60206 - Specific literatures
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has been successful in relation to its terms of reference (its goals and at least 75 % of the expected applied results and B-type results listed in the Contract have been achieved ? i. e. at least 75 % of each result type).
Solution timeline
Realization period - beginning
Jan 27, 2011
Realization period - end
Dec 31, 2014
Project status
U - Finished project
Latest support payment
Mar 18, 2014
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP15-MK0-DF-U/01:1
Data delivery date
Jul 1, 2015
Finance
Total approved costs
15,605 thou. CZK
Public financial support
15,605 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK