Sound-dependet spectral warping in voice identity conversion
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985882%3A_____%2F05%3A00021857" target="_blank" >RIV/67985882:_____/05:00021857 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Sound-dependet spectral warping in voice identity conversion
Original language description
In this paper a new sound dependent spectral warping is introduced, where different warping functions for different frames of the source speech are used. Warping functions are obtained by averaging the optimum frequency functions between the appropriatesource and target short-time spectra of time aligned training sequences. Averaging is computed only in regions of vector-quantized source speech. The proposed voice identity conversion also considers the change of speaker voice prosody.
Czech name
Zvukově závislá transformace spektra při změně identity hlasu
Czech description
V článku je zavedena zvukově závislá úprava spektra, při které se používají různé transformační funkce pro různé segmenty zdrojové řeči. Transformační funkce se získávají průměrováním optimálních kmitočtových funkcí odpovídajících zdrojových a cílových krátkodobých spekter časově přizpůsobených trénovacích posloupností. Průměrování se provádí pouze v oblastech vektorově kvantované zdrojové řeči. Navržená konverse identity hlasu uvažuje také změnu prosodie mluvčího.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Elektronische Sprachsignalverarbeitung
ISBN
0940-6832
ISSN
—
e-ISSN
—
Number of pages
7
Pages from-to
423-429
Publisher name
TUDpress
Place of publication
Dresden
Event location
Praha
Event date
Sep 26, 2005
Type of event by nationality
EUR - Evropská akce
UT code for WoS article
—