Modul pro automatickou tvorbu hlasových modelů pacientů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957808" target="_blank" >RIV/49777513:23520/19:43957808 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Modul pro automatickou tvorbu hlasových modelů pacientů
Popis výsledku v původním jazyce
Popisovaný software je modul do plánované platformy automatické hlasové konzervace, který zajišťuje plně automatické zpracování nahrávek pacienta (řečníka), tj. nalezení hranic fonetických jednotek, trénování akustických modelů řečových jednotek a jejich suprasegmentálních charakteristik, výpočet příznaků pro syntetizér a další úkony nutné k automatizaci přípravy hlasového modelu (popř. sady modelů) pro personalizovanou syntézu řeči s využitím metody statistické parametrické syntézy (prostřednictvím rekurentních neuronových sítí). Výstupem modulu je statistický model (hluboká rekurentní neuronová síť), resp. sada modelů (hlasový balíček daného pacienta), které si po integraci do výsledné platformy hlasové konzervace bude mít uživatel možnost stáhnout, nainstalovat a provozovat jej v systému syntézy řeči kompatibilním se statistickou parametrickou metodou syntézy pomocí rekurentních neuronových sítí.
Název v anglickém jazyce
Software module for automatic building of voice models
Popis výsledku anglicky
The described software is a module for a developed framework for automatic voice conservation, that performs a fully automatic processing of patient's speech recordings, i.e. location of phonetic units, extracting of acoustic, phonetic and suprasegmental features, training of corresponding statistical models and other procedures within an automatic preparation of a voice model (or set of models) for a personalized speech synthesis by using statistical parametric speech synthesis (based on recurrent neural networks). The output of the module is a statistical model (deep recurent neural network) or a set of models (voice package for the given pacient). This voice package will be integrated into the resulting framework for voice conseravation and will be available for download, install and run in a speech synthesis system compactible with the recurrent neural network based speech synthesis.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
AutoVoiceModel
Technické parametry
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. Sada skriptů v jazyce Python (verze 3.7), konfigurační soubory a aplikace v jazyce C++, spustitelné na OS Linux nebo MS Windows 10. HW požadavky: CPU Intel nebo AMD, 32 GB paměti RAM, pevný disk s minimálně 20 GB volného místa, doporučeno GPU s podporou NVIDIA CUDA. Bližší informace na http://www.kky.zcu.cz/cs/sw/autovoicemodel - doc. Ing. Jindřich Matoušek, Ph.D., nadřazené pracoviště: NTIS , E-mail: jmatouse@ntis.zcu.cz, Telefon: 37763 2530
Ekonomické parametry
Hlasové balíčky (produkované tímto modulem) umožňují rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Využití syntézy řeči založené na rekurentních neuronových sítích umožňuje generování řeči s dobrou kvalitou i při relativně menším množství trénovacích nahrávek, zároveň není tato metoda přiliš citlivá na případné chyby v těchto nahrávkách (ve srovnání s jinými metodami syntézy řeči). Všechny tyto aspekty v konečném důsledku rozšíří skupinu potenciálních uživatelů platformy "automatické konzervace a rekonstrukce hlasu".
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni