Anglické prozodické modely pro syntézu řeči ve výukovém stylu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F22%3A43967454" target="_blank" >RIV/49777513:23520/22:43967454 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.kky.zcu.cz/cs/sw/ttsteach_prosmodel_en" target="_blank" >https://www.kky.zcu.cz/cs/sw/ttsteach_prosmodel_en</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Anglické prozodické modely pro syntézu řeči ve výukovém stylu
Popis výsledku v původním jazyce
Zakázka smluvního výzkumu byla cílena na vývoj softwarové knihovny pro prozodické modelování angličtiny pro TTS ve výukovém stylu. Řešení zahrnuje prozodickou analýzu řečových dat cílových hlasů anglického jazyka za účelem určení klíčových prozodických jevů v jednotlivých hlasech, resp. v daném jazyce, nalezení vhodné topologie prozodických modelů (ve formě hlubokých neuronových sítí), natrénování intonačních modelů a modelů trvání a otestování vytvořených prozodických modelů. Výsledné prozodické modely jsou reprezentovány jako datové soubory kompatibilní s formátem SpeechTech TTS engine.
Název v anglickém jazyce
English prosodic models for teaching-style speech synthesis
Popis výsledku anglicky
The contract research contract was aimed at developing a software library for teaching-style prosodic modelling for English TTS. The solution involves prosodic analysis of speech data of target English language voices to identify key prosodic phenomena in individual voices or in a given language, finding a suitable topology of prosodic models (in the form of deep neural networks), training intonation and duration models, and testing the developed prosodic models. The resulting prosodic models are represented as data files compatible with the SpeechTech TTS engine format.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ttsteach_prosmodel_en
Technické parametry
SW knihovna - datové soubory reprezentující prozodické modely kompatibilní s frameworkem Speechtech TTS engine. Bližší informace: https://www.kky.zcu.cz/cs/sw/ttsteach_prosmodel_en. Kontaktní osoba: doc. Ing. Jindřich Matoušek, Ph.D., ZČU v Plzni, Univerzitní 8, 306 14 Plzeň, e-mail: jmatouse@kky.zcu.cz, telefon: 377632530.
Ekonomické parametry
Výsledek byl řešen formou smluvního výzkumu smlouva č. OB2306/2021 a OB2306/2022, zakázkové č. 529032/52240/9011. Výsledek je využíván zadavatelem.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni