Statistický přístup k automatickému vytvoření databáze řečových jednotek pro syntézu češtiny
Cíle projektu
Navrhovaný postdoktorandský projekt se zaměřuje na řešení jedné problémové oblasti rozsáhlé a náročné problematiky návrhu systému konverze textu na řeč (TTS). Konkrétně se řešení předkládaného projektu bude soustředit na řešení úkolů spojených spřípravoudatabáze řečových jednotek. Při řešení bychom chtěli navázat na náš předchozí výzkum - aplikovat a zdokonalit statistický přístup k automatické konstrukci databáze řečových jednotek. Tento přístup je založen na použití skrytých Markovovýchmodelů (HMM) pro automatické modelování řečových jednotek (předpokládá se využití kontextově závislých řečových jednotek - trifónů) na základě rozsáhlého řečového korpusu a následnou automatickou segmentaci řečového korpusu na zvolené řečové jednotky. Vrámci řešení projektu se počítá mj. s vytvořením nového rozsáhlého řečového korpusu jednoho řečníka, jehož součástí budou mj. hlasivkové signály, z nichž se pomocí navrženého algoritmu budou automaticky určovat okamžiky hlavního vybuzení hlasového
Klíčová slova
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Postdoktorandské granty
Veřejná soutěž
Postdoktorandské granty 2 (SGA02002GA-PD)
Hlavní účastníci
Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Statistical approach to automatic speech segment database construction for synthesis of Czech
Anotace anglicky
The proposed post-doctoral project aims to the solution of one of the problems that have to be solved when a text-to-speech (TTS) system is developed. Concretely, the solution of the planned project will focus on the solution of tasks that involve theconstruction of a speech segment database. We would like to continue in our previous research and refine the statistical approach to the automatic speech segment database construction. This approach is based on the usage of hidden Markov models (HMM) forboth the automatic speech units modelling (context-dependent speech units - triphones - are supposed to be used) on the basis of a large speech corpus and the automatic segmentation of the speech corpus into selected speech units. A new large singlespeakerspeech corpus is planned to be built, which will include among others also glottal signals. Glottal signals will be used for the automatic pitch-mark detection. Different parameters of the described approach will be also explored to find their
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)20204 - Robotics and automatic control
20205 - Automation and control systems
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Cíle projektu se soustředily především na podporu řešení jedné subúlohy systému konverze textu na řeč (TTS), která se týká konstrukce databáze řečových jednotek (SSD). Pro potřeby projektu byl vytvořen rozsáhlý, pečlivě anotovaný a dostatečně reprezentat
Termíny řešení
Zahájení řešení
1. 1. 2002
Ukončení řešení
1. 1. 2004
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP/2005/GA0/GA05GP/U/N/A:8
Datum dodání záznamu
23. 7. 2008
Finance
Celkové uznané náklady
570 tis. Kč
Výše podpory ze státního rozpočtu
444 tis. Kč
Ostatní veřejné zdroje financování
126 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Uznané náklady
570 tis. Kč
Statní podpora
444 tis. Kč
0%
Poskytovatel
Grantová agentura České republiky
CEP
JD - Využití počítačů, robotika a její aplikace
Doba řešení
01. 01. 2002 - 01. 01. 2004