Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Modul pro automatickou tvorbu hlasových modelů pacientů

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957808" target="_blank" >RIV/49777513:23520/19:43957808 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Modul pro automatickou tvorbu hlasových modelů pacientů

  • Popis výsledku v původním jazyce

    Popisovaný software je modul do plánované platformy automatické hlasové konzervace, který zajišťuje plně automatické zpracování nahrávek pacienta (řečníka), tj. nalezení hranic fonetických jednotek, trénování akustických modelů řečových jednotek a jejich suprasegmentálních charakteristik, výpočet příznaků pro syntetizér a další úkony nutné k automatizaci přípravy hlasového modelu (popř. sady modelů) pro personalizovanou syntézu řeči s využitím metody statistické parametrické syntézy (prostřednictvím rekurentních neuronových sítí). Výstupem modulu je statistický model (hluboká rekurentní neuronová síť), resp. sada modelů (hlasový balíček daného pacienta), které si po integraci do výsledné platformy hlasové konzervace bude mít uživatel možnost stáhnout, nainstalovat a provozovat jej v systému syntézy řeči kompatibilním se statistickou parametrickou metodou syntézy pomocí rekurentních neuronových sítí.

  • Název v anglickém jazyce

    Software module for automatic building of voice models

  • Popis výsledku anglicky

    The described software is a module for a developed framework for automatic voice conservation, that performs a fully automatic processing of patient&apos;s speech recordings, i.e. location of phonetic units, extracting of acoustic, phonetic and suprasegmental features, training of corresponding statistical models and other procedures within an automatic preparation of a voice model (or set of models) for a personalized speech synthesis by using statistical parametric speech synthesis (based on recurrent neural networks). The output of the module is a statistical model (deep recurent neural network) or a set of models (voice package for the given pacient). This voice package will be integrated into the resulting framework for voice conseravation and will be available for download, install and run in a speech synthesis system compactible with the recurrent neural network based speech synthesis.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    20205 - Automation and control systems

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2019

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    AutoVoiceModel

  • Technické parametry

    Projekt &quot;Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii&quot; - TH02010307, 01/ 2017 - 12/2020. Sada skriptů v jazyce Python (verze 3.7), konfigurační soubory a aplikace v jazyce C++, spustitelné na OS Linux nebo MS Windows 10. HW požadavky: CPU Intel nebo AMD, 32 GB paměti RAM, pevný disk s minimálně 20 GB volného místa, doporučeno GPU s podporou NVIDIA CUDA. Bližší informace na http://www.kky.zcu.cz/cs/sw/autovoicemodel - doc. Ing. Jindřich Matoušek, Ph.D., nadřazené pracoviště: NTIS , E-mail: jmatouse@ntis.zcu.cz, Telefon: 37763 2530

  • Ekonomické parametry

    Hlasové balíčky (produkované tímto modulem) umožňují rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Využití syntézy řeči založené na rekurentních neuronových sítích umožňuje generování řeči s dobrou kvalitou i při relativně menším množství trénovacích nahrávek, zároveň není tato metoda přiliš citlivá na případné chyby v těchto nahrávkách (ve srovnání s jinými metodami syntézy řeči). Všechny tyto aspekty v konečném důsledku rozšíří skupinu potenciálních uživatelů platformy &quot;automatické konzervace a rekonstrukce hlasu&quot;.

  • IČO vlastníka výsledku

    49777513

  • Název vlastníka

    Západočeská univerzita v Plzni