Kvalita neurální syntézy řeči v závislosti na množství trénovacích dat
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F23%3A43970720" target="_blank" >RIV/49777513:23520/23:43970720 - isvavai.cz</a>
Výsledek na webu
<a href="http://svk.fav.zcu.cz/download/proceedings_svk_2023.pdf" target="_blank" >http://svk.fav.zcu.cz/download/proceedings_svk_2023.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Kvalita neurální syntézy řeči v závislosti na množství trénovacích dat
Popis výsledku v původním jazyce
Počítačová syntéza řeči umožňuje z nahrávek řeči rekonstruovat hlas řečníka a následně jej použít pro "čtení" libovolného textu. Velmi dobrých výsledků dosahuje zejména syntéza založená na neuronových sítích. Syntetizér pracující tímto způsobem je, zjednodušeně řečeno, funkce závislá na velkém množství parametrů. Pro správné fungování syntetizéru je pak nutné najít optimální hodnoty těchto parametrů. Máme-li k dispozici nahrávky hlasu určitého člověka, můžeme pomocí metod strojového učení nalézt parametry, při jejichž použití syntetizér generuje řeč co možná nejpodobnější hlasu tohoto řečníka (tj. tzv. trénování neuronového modelu).
Název v anglickém jazyce
Quality of neural synthesizers as a function of the amount of training data
Popis výsledku anglicky
Computer speech synthesis allows the speaker's voice to be reconstructed from the speech recordings and then used to "read" any text. In particular, neural network-based synthesis achieves very good results. A synthesizer working in this way is, simply put, a function dependent on a large number of parameters. To make the synthesizer work properly, it is then necessary to find the optimal values of these parameters. If we have recordings of a particular person's voice, we can use machine learning methods to find the parameters that make the synthesizer generate speech as similar as possible to that speaker's voice (i.e., neural model training).
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů