Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

První krůčky k novému českému systému pro konverzi řeči

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000020" target="_blank" >RIV/49777513:23520/06:00000020 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    First steps towards new Czech voice conversion system

  • Popis výsledku v původním jazyce

    In this paper we deal with initial experiments on creating a new Czech voice conversion system. VC is a process which modifies the speech signal produced by source speaker so that it sounds like target speaker. Using VC technique a new voice for speech synthetizer can be gained with no need to record a huge amount of new speech data. The transformation is determined using equal sentences from both speakers; these sentences are time-aligned using modified DTW algorithm. The conversion is divided into twoindependent stages corresponding to the source-filter model of speech production. We employ conversion function based on GMM for transforming the spectral envelope described by LSFs. Residua are converted using so called residual prediction techniques.Unlike in other similar research works, we predict residua not from the transformed spectral envelope, but directly from the source speech. Four versions of residual prediction are described and compared in this study.

  • Název v anglickém jazyce

    First steps towards new Czech voice conversion system

  • Popis výsledku anglicky

    In this paper we deal with initial experiments on creating a new Czech voice conversion system. VC is a process which modifies the speech signal produced by source speaker so that it sounds like target speaker. Using VC technique a new voice for speech synthetizer can be gained with no need to record a huge amount of new speech data. The transformation is determined using equal sentences from both speakers; these sentences are time-aligned using modified DTW algorithm. The conversion is divided into twoindependent stages corresponding to the source-filter model of speech production. We employ conversion function based on GMM for transforming the spectral envelope described by LSFs. Residua are converted using so called residual prediction techniques.Unlike in other similar research works, we predict residua not from the transformed spectral envelope, but directly from the source speech. Four versions of residual prediction are described and compared in this study.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/1ET101470416" target="_blank" >1ET101470416: Multimodální zpracování lidské znakové a mluvené řeči počítačem pro komunikaci člověk-stroj</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2006

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Lecture Notes in Artificial Intelligence

  • ISBN

    3-540-39090-1

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    8

  • Strana od-do

  • Název nakladatele

    Springer

  • Místo vydání

    Berlin

  • Místo konání akce

    Brno

  • Datum konání akce

    15. 9. 2006

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku

    000241103500048