Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Kvalita neurální syntézy řeči v závislosti na množství trénovacích dat

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F23%3A43970720" target="_blank" >RIV/49777513:23520/23:43970720 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://svk.fav.zcu.cz/download/proceedings_svk_2023.pdf" target="_blank" >http://svk.fav.zcu.cz/download/proceedings_svk_2023.pdf</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Kvalita neurální syntézy řeči v závislosti na množství trénovacích dat

  • Popis výsledku v původním jazyce

    Počítačová syntéza řeči umožňuje z nahrávek řeči rekonstruovat hlas řečníka a následně jej použít pro &quot;čtení&quot; libovolného textu. Velmi dobrých výsledků dosahuje zejména syntéza založená na neuronových sítích. Syntetizér pracující tímto způsobem je, zjednodušeně řečeno, funkce závislá na velkém množství parametrů. Pro správné fungování syntetizéru je pak nutné najít optimální hodnoty těchto parametrů. Máme-li k dispozici nahrávky hlasu určitého člověka, můžeme pomocí metod strojového učení nalézt parametry, při jejichž použití syntetizér generuje řeč co možná nejpodobnější hlasu tohoto řečníka (tj. tzv. trénování neuronového modelu).

  • Název v anglickém jazyce

    Quality of neural synthesizers as a function of the amount of training data

  • Popis výsledku anglicky

    Computer speech synthesis allows the speaker&apos;s voice to be reconstructed from the speech recordings and then used to &quot;read&quot; any text. In particular, neural network-based synthesis achieves very good results. A synthesizer working in this way is, simply put, a function dependent on a large number of parameters. To make the synthesizer work properly, it is then necessary to find the optimal values of these parameters. If we have recordings of a particular person&apos;s voice, we can use machine learning methods to find the parameters that make the synthesizer generate speech as similar as possible to that speaker&apos;s voice (i.e., neural model training).

Klasifikace

  • Druh

    O - Ostatní výsledky

  • CEP obor

  • OECD FORD obor

    20205 - Automation and control systems

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2023

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů