Digitální otisk hlasu Karla Gotta
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F23%3A43971171" target="_blank" >RIV/49777513:23520/23:43971171 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.kky.zcu.cz/cs/sw/CRo-Gott" target="_blank" >https://www.kky.zcu.cz/cs/sw/CRo-Gott</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Digitální otisk hlasu Karla Gotta
Popis výsledku v původním jazyce
Zakázka smluvního výzkumu byla cílena na vývoj softwarového modulu, který umožní vytvořit digitální otisk hlasu Karla Gotta a jeho využití v přesně definovaném projektu Českého rozhlasu GOTT NAVŽDY (gott.rozhlas.cz). Řešení zahrnuje: 1) akustickou a fonetickou analýzu dodaných řečových nahrávek a odpovídajících ortografických přepisů, kontrolu duplicit řečového souboru nahrávek; 2) fonetickou segmentaci anotovaných nahrávek (včetně nalezení hranic mezi jednotlivými hláskami a automatické opravy výslovnosti podle předtrénovaných akustických modelů); 3) tvorbu neurálního modelu ze zpracovaných nahrávek, vhodného pro syntézu specifikovaného hlasu (Karla Gota), analýzu modelů, volbu vhodné architektury neuronové sítě, trénování a validaci modelů; 4) syntézu dodaných vět z natrénovaného modelu, popř. z více natrénovaných modelů.
Název v anglickém jazyce
Digital voiceprint of Karel Gott
Popis výsledku anglicky
The contract research was aimed at developing a software module that will enable the creation of a digital imprint of Karel Gott's voice and its use in a precisely defined project of Czech Radio GOTT NAVŽDY (gott.rozhlas.cz). The solution includes: 1) acoustic and phonetic analysis of the provided speech recordings and corresponding orthographic transcriptions, checking for duplicates in the speech file of the recordings; 2) phonetic segmentation of the annotated recordings (including finding boundaries between individual phones and automatic pronunciation correction according to pre-trained acoustic models); 3) creation of a neural model from the processed recordings, suitable for synthesis of the specified voice (Karel Gott), analysis of the models, selection of an appropriate neural network architecture, training and validation of the models; 4) synthesis of the supplied sentences from the trained model, or, alternatively, from multiple trained models.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
CRo-Gott
Technické parametry
Softwarový modul - programový modul ve formě zdrojového kódu Python pro tvorbu a trénování neurálního řečového modelu a inferenci ze vstupního textu. Formát datového souboru kompatibilní s formátem Speechtech TTS engine. Bližší informace: https://www.kky.zcu.cz/cs/sw/CRo-Gott. Kontaktní osoba: doc. Ing. Jindřich Matoušek, Ph.D., ZČU v Plzni, Univerzitní 8, 306 14 Plzeň, e-mail: jmatouse@kky.zcu.cz, telefon: 377632530.
Ekonomické parametry
Výsledek byl řešen formou smluvního výzkumu smlouva č. OB1004/2023, zakázkové č. 529032/52240/9011. Výsledek byl využit zadavatelem.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni