Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Akustický a jazykový model spontánní ruštiny

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000058" target="_blank" >RIV/49777513:23520/05:00000058 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/49777513:23520/05:00000008

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Russian Spontaneaous Speech – Acoustic&Language Models (MALACH)

  • Popis výsledku v původním jazyce

    The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 7,050 Russian testimonies with a total length of 16,000 hours. It is not feasible to transcribe all thosetestimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system &#8211; data forthe system development were acquired from the Russian Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6969 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.

  • Název v anglickém jazyce

    Russian Spontaneaous Speech – Acoustic&Language Models (MALACH)

  • Popis výsledku anglicky

    The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 7,050 Russian testimonies with a total length of 16,000 hours. It is not feasible to transcribe all thosetestimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system &#8211; data forthe system development were acquired from the Russian Malach Speech Corpus. The basic AM unit is a triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6969 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.

Klasifikace

  • Druh

    X - Nezařazeno

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2005

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů