Automatic audio signal segmentation for spoken document retrieval tasks
Project goals
Huge development in the field of automatic human voice to text transcription together with growing influence of electronic mass media and voice communication devices expansion caused that automatic media monitoring and spoken document retrieval became topics of the day. Speech Laboratory at the Technical University of Liberec has a long tradition in the research of fluent speech to text transcription. Contemporary its activity is concentrated on broadcast programs transcription. Essential part of everystate of the art transcription system is speaker change detector. The goal of this project is to develop fully automated segmentator respecting especially speaker changes. It could be shown that commonly used statistical change-point models can't providesegmentation with high enough precision. To improve the segmentator it is planed to combine common approach with an analysis of further informational content of acoustic record, namely appearances of specific acoustic elements.
Keywords
speaker change detectionaudio signal segmentationmedia mining
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 7 (SGA02007GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
102/07/P430
Alternative language
Project name in Czech
Automatická segmentace audio signálu v úlohách vytěžování informací z mluvených dokumentů
Annotation in Czech
S výrazným pokrokem v oblasti automatického přepisu lidské řeči, vzrůstajícím vlivem elektronických masmédií a s rozšířením hlasových komunikačních prostředků se stal monitoring médií a prohledávání záznamů obsahujících lidskou řeč jedním z nejožehavějších témat současného výzkumu v oblasti zpracování řeči. Laboratoř počítačového zpracování řeči na TUL má dlouhou tradici ve vývoji technologie automatického přepisu plynulé řeči a nyní se její výzkumná aktivita soustředí na transkripci televizního a rozhlasového zpravodajství. Nezbytným krokem k plně automatizovanému přístupu vytěžování informací z mluvených záznamů je precizní automatická segmentace. Cíl projektu je vyvinout plně automatický segmentátor umožňující segmentovat audio záznam především v místech změny mluvčího. Běžné statistické modely potencionálního bodu změny však nevedou bez dalších přídavných informací k uspokojivé segmentaci, především z hlediska přesnosti lokalizace. Pro segmentátor tedy bude využito kombinace
Scientific branches
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
.
Solution timeline
Realization period - beginning
Jan 1, 2007
Realization period - end
Dec 31, 2009
Project status
U - Finished project
Latest support payment
Apr 22, 2009
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP10-GA0-GP-U/03:3
Data delivery date
Mar 1, 2016
Finance
Total approved costs
708 thou. CZK
Public financial support
708 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
708 CZK thou.
Public support
708 CZK thou.
100%
Provider
Czech Science Foundation
CEP
JD - Use of computers, robotics and its application
Solution period
01. 01. 2007 - 31. 12. 2009