Multilingual Automatic Detection of Structural Events in Speech
Public support
Provider
Ministry of Education, Youth and Sports
Programme
KONTAKT
Call for proposals
KONTAKT 5 (SMSM2007ME2)
Main participants
—
Contest type
VS - Public tender
Contract ID
2783/2009-32
Alternative language
Project name in Czech
Vícejazyčná automatická detekce strukturálních událostí v mluvené řeči
Annotation in Czech
Tento projekt má za cíl podpořit užší spolupráci Katedry kybernetiky FAV ZČU v Plzni se špičkovými pracovišti v USA, Human Language Technology Research Institute při University of Texas at Dallas a výzkumným institutem SRI International v oblasti automatického rozpoznávání řeči. Projekt je zaměřen na automatickou detekci ?strukturálních událostí? v mluvené řeči, která je klíčová pro umožnění následného automatického zpracování rozpoznaného textu. Mezi strukturální události v řeči patří hranice vět, ?neplynulosti? a další jevy, které nejsou standardně označeny v ?proudu slov?, který je výstupem konvenčních automatických rozpoznávačů řeči. Hlavním cílem spolupráce je vyvíjení metod pro automatickou detekci strukturálních událostí ve zvukových dokumentechve více různých jazycích, které se od sebe výrazně liší v syntaktické, fonetické i prozodické struktuře. Plánována je práce zejména na angličtině a češtině, počítá se ale i s rozšířením práce na arabštinu a mandarínskou čínštinu, příp. další jazyky.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
JD - Use of computers, robotics and its application
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
20204 - Robotics and automatic control<br>20205 - Automation and control systems
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
We created a Czech speech database with structural metadata. We developed an automatic systém for sentence boundary detection. Systém performance has been analyzed in terms of language, genre, and speaker identity differences. The cooperation among UWB,UT Dallas and SRI Int. has been deepened.
Solution timeline
Realization period - beginning
May 1, 2007
Realization period - end
Dec 31, 2009
Project status
U - Finished project
Latest support payment
Feb 24, 2009
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP10-MSM-ME-U/01:1
Data delivery date
Jun 30, 2010
Finance
Total approved costs
822 thou. CZK
Public financial support
742 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
80 thou. CZK