Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítí
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 23 (SGA0201900001)
Hlavní účastníci
Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
19-19324S
Alternativní jazyk
Název projektu anglicky
Fully Trainable Deep Neural Network Based Czech Text-to-Speech Synthesis
Anotace anglicky
The project aims at basic research into speech synthesis. Its main goal is to propose a unified fully trainable statistical framework for generating high-quality speech from text, with the focus on the Czech language. The main focus will be given on WaveNet, a powerful convolutional deep neural network (DNN) for generating high-quality speech in a sample-by-sample manner. Other goals concern selection and statistical modeling of appropriate linguistic and prosodic features and a way WaveNet can be appropriately conditioned by these features. Firstly, linguistic/phonetic and prosodic contexts will be used as an intermediate representation between the input text and output speech, modeled separately by different DNNs and used to condition WaveNet-based speech generation. Secondly, a fully trainable end-to-end system transforming input text directly to output speech without a need to use the explicit phonetic and/or prosodic representation will be proposed. Beside the improvement of the synthetic speech, the trainable framework allows speeding up the creation of new synthetic voices.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 1. 2019
Ukončení řešení
30. 6. 2022
Poslední stav řešení
—
Poslední uvolnění podpory
1. 4. 2022
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP23-GA0-GA-R
Datum dodání záznamu
26. 6. 2023
Finance
Celkové uznané náklady
6 037 tis. Kč
Výše podpory ze státního rozpočtu
5 698 tis. Kč
Ostatní veřejné zdroje financování
339 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč