Text-To-Speech synthesis using HMM-based triphones
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F99%3A00044605" target="_blank" >RIV/49777513:23520/99:00044605 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Text-To-Speech synthesis using HMM-based triphones
Popis výsledku v původním jazyce
Automatic construction of a Czech speech segment database (SSD) from a single speaker natural speech corpus using multiple Hidden Markov Models (HMMs) and an approach to speech synthesis based on this inventory are presented in this paper. HMMs are usedto model triphones. Binary decision trees are employed to automatically cluster the states of triphones. Resulting models are used to segment the speech corpus and to create a SSD. The SSD constructed in this way is assumed to enable more precise contextmodeling than was previously possible. Several speech synthesis techniques are discussed to design a concatenation-based synthesizer. We will focus on an MFCC-based pitch-synchronous residually excited approach.
Název v anglickém jazyce
Text-To-Speech synthesis using HMM-based triphones
Popis výsledku anglicky
Automatic construction of a Czech speech segment database (SSD) from a single speaker natural speech corpus using multiple Hidden Markov Models (HMMs) and an approach to speech synthesis based on this inventory are presented in this paper. HMMs are usedto model triphones. Binary decision trees are employed to automatically cluster the states of triphones. Resulting models are used to segment the speech corpus and to create a SSD. The SSD constructed in this way is assumed to enable more precise contextmodeling than was previously possible. Several speech synthesis techniques are discussed to design a concatenation-based synthesizer. We will focus on an MFCC-based pitch-synchronous residually excited approach.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/VS97159" target="_blank" >VS97159: Centrum pro výzkum kybernetických systémů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
1999
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text-To-Speech synthesis using HMM-based triphones
ISBN
—
ISSN
—
e-ISSN
—
Počet stran výsledku
1
Strana od-do
—
Název nakladatele
Digital Media Services in conjuction with DSP World
Místo vydání
Orlando
Místo konání akce
—
Datum konání akce
—
Typ akce podle státní příslušnosti
—
Kód UT WoS článku
—