Interactive Keyword Detector
Project goals
In the last years, we have been involved in European projects M4 and AMI. One of the objectives of these projects was development of a browser allowing for easy navigation in recorded meeting, tracing its interesting parts and their playback. It was found that it would be extremely valuable to extend existing browser with functionality of fast interactive keyword detection. The classical keyword spotting methods based only on evaluation of statistical acoustic models are too slow for this purpose. The aim of this project is to develop a fast and reliable detector allowing for an interactive keyword search in tens of hours of recorded meetings. The detector will use a hierarchical approach, where acoustic data are first converted into form of phoneme lattices by phone recognizer. When a keyword is specified, it can be quickly looked up in the lattices. The found keyword occurrences will be further verified using statistical models on acoustic data to increase the keyword detection
Keywords
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 6 (SGA02006GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
102/06/P383
Alternative language
Project name in Czech
Interaktivní detektor klíčových slov
Annotation in Czech
V posledních letech se účastníme evropských projektů M4 a AMI. Jedním z úkolů těchto projektů je vývoj nástroje dovolujícího snadnou navigaci v záznamu meetingu, vyhledávání zajímavých částí meetingu a jejich přehrávku. Ukázalo se, že by bylo velmi užitečné rozšířit tento nástroj o funkci rychlého interaktivního vyhledávání klíčových slov. Klasické metody detekce klíčových slov postavené pouze na vyhodnocení statistických akustických modelů jsou pro tento účel příliš pomalé. Cílem tohoto projektu je tedy vývoj rychlého a spolehlivého detektoru klíčových slov dovolujícího interaktivní vyhledávání klíčových slov v řádově desítkách hodinách záznamu meetingů. Pro detektor bude použito hierarchického přístupu. Akustická data budou pomocí fonémového rozpoznávače nejprve konvertována do podoby fonémového svazu. Po zadaní klíčového slova, bude toto slovo ve fonémovém svazu rychle vyhledáno a pro zvýšení spolehlivosti detekce bude dodatečně verifikováno na akustických datech pomocí statistických
Scientific branches
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The project investigated into several aspects of keyword spotting that lead to truly useable keyword spotting system, namely: improving of large vocabulary continuous speech recognition system (feature extraction, acoustic modeling, use of heterogeneous
Solution timeline
Realization period - beginning
Jan 1, 2006
Realization period - end
Dec 31, 2008
Project status
U - Finished project
Latest support payment
Apr 25, 2008
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP09-GA0-GP-U/03:3
Data delivery date
Jan 22, 2015
Finance
Total approved costs
855 thou. CZK
Public financial support
855 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
855 CZK thou.
Public support
855 CZK thou.
100%
Provider
Czech Science Foundation
CEP
JC - Computer hardware and software
Solution period
01. 01. 2006 - 31. 12. 2008