Making Czech Historical Radio Archive Accessible and Searchable for Wide Public
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F12%3A%230002005" target="_blank" >RIV/46747885:24220/12:#0002005 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.4304/jmm.7.2.159-169" target="_blank" >http://dx.doi.org/10.4304/jmm.7.2.159-169</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.4304/jmm.7.2.159-169" target="_blank" >10.4304/jmm.7.2.159-169</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Making Czech Historical Radio Archive Accessible and Searchable for Wide Public
Popis výsledku v původním jazyce
In this paper we describe a complex software platform that is being developed for the automatic transcription and indexation of the Czech Radio archive of spoken documents. The archive contains more than 100.000 hours of audio recordings covering almostninety years of public broadcasting in the Czech Republic and former Czechoslovakia. The platform is based on modern speech processing technology and includes modules for speech, speaker and language recognition, and tools for multimodal information retrieval. The aim of the project supported by the Czech Ministry of Culture is to make the archive accessible and searchable both for researchers as well as for wide public. After the first project?s year, the key modules have been already implemented and tested on a 27.400-hour subset of the archive. A web-based full-text search engine allows for the demonstration of the project?s current state.
Název v anglickém jazyce
Making Czech Historical Radio Archive Accessible and Searchable for Wide Public
Popis výsledku anglicky
In this paper we describe a complex software platform that is being developed for the automatic transcription and indexation of the Czech Radio archive of spoken documents. The archive contains more than 100.000 hours of audio recordings covering almostninety years of public broadcasting in the Czech Republic and former Czechoslovakia. The platform is based on modern speech processing technology and includes modules for speech, speaker and language recognition, and tools for multimodal information retrieval. The aim of the project supported by the Czech Ministry of Culture is to make the archive accessible and searchable both for researchers as well as for wide public. After the first project?s year, the key modules have been already implemented and tested on a 27.400-hour subset of the archive. A web-based full-text search engine allows for the demonstration of the project?s current state.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/DF11P01OVV013" target="_blank" >DF11P01OVV013: Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Journal of Multimedia
ISSN
1796-2048
e-ISSN
—
Svazek periodika
7
Číslo periodika v rámci svazku
2
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
11
Strana od-do
159-169
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—