Syntéza řeči z textu s využitím statistického přístupu k automatickému vytvoření databáze řečových jednotek
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F00%3A00061778" target="_blank" >RIV/49777513:23520/00:00061778 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Syntéza řeči z textu s využitím statistického přístupu k automatickému vytvoření databáze řečových jednotek
Popis výsledku v původním jazyce
Tato disertační práce se zabývá nejsložitější úlohou umělého vytváření řeči počítačem - syntézou řeči z textu (TTS). Hlavním cílem je aplikovat nový přístup k syntéze řeči z textu založený na statistických metodách modelování řečových jednotek s využitímrozsáhlého řečového korpusu. Tento přístup je i ve světě nový a pro syntézu češtiny zatím nebyl aplikován. Během vývoje TTS systému je třeba řešit několik úloh - od vytvoření databáze řečových jednotek (automaticky pomocí skrytých Markovových modelů) přes zpracování textu (s využitím českých fonetických transkripčních pravidel) až po samotnou syntézu řeči (pomocí techniky PSOLA). Navržený systém je schopný generovat srozumitelnou řeč přijatelné kvality na základě libovolného textu. Práce tedy ukazuje, že pro syntézu češtiny je možné využít statistického přístupu k automatickému vytvoření databáze řečových jednotek na základě rozsáhlého řečového korpusu.
Název v anglickém jazyce
Text-to-speech synthesis using a statistical approach to an automatic construction of a speech segment database: ARTIC - a Czech TTS system
Popis výsledku anglicky
This thesis deals with the most complex task of the artificial speech production - text-to-speech synthesis (TTS). The main aim is to apply a new approach to text-to-speech synthesis based on statistical methods of speech unit modeling using a large speech corpus. This approach is new in the world now and has not been applied to the synthesis of Czech speech so far. During the development of the system it is necessary to solve several tasks: especially speech segment database construction (automaticallyusing Hidden Markov Models), text processing (using Czech phonetic transcription rules) and speech synthesis (using PSOLA techniques). The proposed system is capable of generating an intelligible speech of acceptable quality from an arbitrary text. Consequently, this thesis shows that it is possible to use the statistical approach to the automatic construction of a speech segment database based on a large corpus for the synthesis of Czech speech.
Klasifikace
Druh
B - Odborná kniha
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2000
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
ISBN
—
Počet stran knihy
1
Název nakladatele
Západočeská univerzita
Místo vydání
Plzeň
Kód UT WoS knihy
—