Statistical approach to automatic speech segment database construction for synthesis of Czech
Project goals
The proposed post-doctoral project aims to the solution of one of the problems that have to be solved when a text-to-speech (TTS) system is developed. Concretely, the solution of the planned project will focus on the solution of tasks that involve theconstruction of a speech segment database. We would like to continue in our previous research and refine the statistical approach to the automatic speech segment database construction. This approach is based on the usage of hidden Markov models (HMM) forboth the automatic speech units modelling (context-dependent speech units - triphones - are supposed to be used) on the basis of a large speech corpus and the automatic segmentation of the speech corpus into selected speech units. A new large singlespeakerspeech corpus is planned to be built, which will include among others also glottal signals. Glottal signals will be used for the automatic pitch-mark detection. Different parameters of the described approach will be also explored to find their
Keywords
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 2 (SGA02002GA-PD)
Main participants
Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
Statistický přístup k automatickému vytvoření databáze řečových jednotek pro syntézu češtiny
Annotation in Czech
Navrhovaný postdoktorandský projekt se zaměřuje na řešení jedné problémové oblasti rozsáhlé a náročné problematiky návrhu systému konverze textu na řeč (TTS). Konkrétně se řešení předkládaného projektu bude soustředit na řešení úkolů spojených spřípravoudatabáze řečových jednotek. Při řešení bychom chtěli navázat na náš předchozí výzkum - aplikovat a zdokonalit statistický přístup k automatické konstrukci databáze řečových jednotek. Tento přístup je založen na použití skrytých Markovovýchmodelů (HMM) pro automatické modelování řečových jednotek (předpokládá se využití kontextově závislých řečových jednotek - trifónů) na základě rozsáhlého řečového korpusu a následnou automatickou segmentaci řečového korpusu na zvolené řečové jednotky. Vrámci řešení projektu se počítá mj. s vytvořením nového rozsáhlého řečového korpusu jednoho řečníka, jehož součástí budou mj. hlasivkové signály, z nichž se pomocí navrženého algoritmu budou automaticky určovat okamžiky hlavního vybuzení hlasového
Scientific branches
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project goals comprised mainly the problems related to the speech segment database (SSD) construction which represents a subtask in a process of text-to-speech (TTS) system design. A large, carefully annotated and sufficiently representative speech c
Solution timeline
Realization period - beginning
Jan 1, 2002
Realization period - end
Jan 1, 2004
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/2005/GA0/GA05GP/U/N/A:8
Data delivery date
Jul 23, 2008
Finance
Total approved costs
570 thou. CZK
Public financial support
444 thou. CZK
Other public sources
126 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
570 CZK thou.
Public support
444 CZK thou.
0%
Provider
Czech Science Foundation
CEP
JD - Use of computers, robotics and its application
Solution period
01. 01. 2002 - 01. 01. 2004