First steps towards new Czech voice conversion system
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000020" target="_blank" >RIV/49777513:23520/06:00000020 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
First steps towards new Czech voice conversion system
Original language description
In this paper we deal with initial experiments on creating a new Czech voice conversion system. VC is a process which modifies the speech signal produced by source speaker so that it sounds like target speaker. Using VC technique a new voice for speech synthetizer can be gained with no need to record a huge amount of new speech data. The transformation is determined using equal sentences from both speakers; these sentences are time-aligned using modified DTW algorithm. The conversion is divided into twoindependent stages corresponding to the source-filter model of speech production. We employ conversion function based on GMM for transforming the spectral envelope described by LSFs. Residua are converted using so called residual prediction techniques.Unlike in other similar research works, we predict residua not from the transformed spectral envelope, but directly from the source speech. Four versions of residual prediction are described and compared in this study.
Czech name
První krůčky k novému českému systému pro konverzi řeči
Czech description
V tomto článku je popsáno několik počátečních experimentů při tvorbě nového českého systému pro konverzi řeči, což je proces, při kterém je transformována promluva od výchozího řečníka tak, aby zněla, jako by ji vyslovil cílový řečník. Použitím této techniky můžeme získat nový hlas pro řečový syntetizér bez nutnosti nahrávání velkého množství promluv od nového řečníka.
Classification
Type
D - Article in proceedings
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1ET101470416" target="_blank" >1ET101470416: Multimodal human sign language and speech processing for man-machine communication</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Lecture Notes in Artificial Intelligence
ISBN
3-540-39090-1
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
Springer
Place of publication
Berlin
Event location
Brno
Event date
Sep 15, 2006
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
000241103500048