Software module for automatic building of voice models
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957808" target="_blank" >RIV/49777513:23520/19:43957808 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Modul pro automatickou tvorbu hlasových modelů pacientů
Original language description
Popisovaný software je modul do plánované platformy automatické hlasové konzervace, který zajišťuje plně automatické zpracování nahrávek pacienta (řečníka), tj. nalezení hranic fonetických jednotek, trénování akustických modelů řečových jednotek a jejich suprasegmentálních charakteristik, výpočet příznaků pro syntetizér a další úkony nutné k automatizaci přípravy hlasového modelu (popř. sady modelů) pro personalizovanou syntézu řeči s využitím metody statistické parametrické syntézy (prostřednictvím rekurentních neuronových sítí). Výstupem modulu je statistický model (hluboká rekurentní neuronová síť), resp. sada modelů (hlasový balíček daného pacienta), které si po integraci do výsledné platformy hlasové konzervace bude mít uživatel možnost stáhnout, nainstalovat a provozovat jej v systému syntézy řeči kompatibilním se statistickou parametrickou metodou syntézy pomocí rekurentních neuronových sítí.
Czech name
Modul pro automatickou tvorbu hlasových modelů pacientů
Czech description
Popisovaný software je modul do plánované platformy automatické hlasové konzervace, který zajišťuje plně automatické zpracování nahrávek pacienta (řečníka), tj. nalezení hranic fonetických jednotek, trénování akustických modelů řečových jednotek a jejich suprasegmentálních charakteristik, výpočet příznaků pro syntetizér a další úkony nutné k automatizaci přípravy hlasového modelu (popř. sady modelů) pro personalizovanou syntézu řeči s využitím metody statistické parametrické syntézy (prostřednictvím rekurentních neuronových sítí). Výstupem modulu je statistický model (hluboká rekurentní neuronová síť), resp. sada modelů (hlasový balíček daného pacienta), které si po integraci do výsledné platformy hlasové konzervace bude mít uživatel možnost stáhnout, nainstalovat a provozovat jej v systému syntézy řeči kompatibilním se statistickou parametrickou metodou syntézy pomocí rekurentních neuronových sítí.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
<a href="/en/project/TH02010307" target="_blank" >TH02010307: Automatic voice banking and reconstruction for patients after total laryngectomy</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2019
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
AutoVoiceModel
Technical parameters
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. Sada skriptů v jazyce Python (verze 3.7), konfigurační soubory a aplikace v jazyce C++, spustitelné na OS Linux nebo MS Windows 10. HW požadavky: CPU Intel nebo AMD, 32 GB paměti RAM, pevný disk s minimálně 20 GB volného místa, doporučeno GPU s podporou NVIDIA CUDA. Bližší informace na http://www.kky.zcu.cz/cs/sw/autovoicemodel - doc. Ing. Jindřich Matoušek, Ph.D., nadřazené pracoviště: NTIS , E-mail: jmatouse@ntis.zcu.cz, Telefon: 37763 2530
Economical parameters
Hlasové balíčky (produkované tímto modulem) umožňují rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Využití syntézy řeči založené na rekurentních neuronových sítích umožňuje generování řeči s dobrou kvalitou i při relativně menším množství trénovacích nahrávek, zároveň není tato metoda přiliš citlivá na případné chyby v těchto nahrávkách (ve srovnání s jinými metodami syntézy řeči). Všechny tyto aspekty v konečném důsledku rozšíří skupinu potenciálních uživatelů platformy "automatické konzervace a rekonstrukce hlasu".
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni