All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Slovak Spontaneaous Speech – Acoustic&Language Models (MALACH)

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000040" target="_blank" >RIV/49777513:23520/06:00000040 - isvavai.cz</a>

  • Alternative codes found

    RIV/49777513:23520/06:00000006

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Slovak Spontaneaous Speech – Acoustic&Language Models (MALACH)

  • Original language description

    The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 580 Slovak testimonies with a total length of 1 300 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system &#8211; data forthe system development were acquired from the Slovak Malach Speech Corpus. The basic AM unit isa triphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 7902 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.

  • Czech name

    Akustický a jazykový model spontánní slovenštiny

  • Czech description

    Visual History Foundation shromáždila v minulých létech cca 52 tisíc výpovědí svědků holocaustu namluvených ve 32 jazycích. Slovenských výpovědí je k dispozici cca 580 s celkovou délkou asi 1 300 hodin. Vzhledem k značné časové a finanční náročnosti nenímožné provést přepisy všech výpovědí manuálně. K přepisu bylo proto využito systému automatického rozpoznávání řeči. Data pro tvorbu modelů byla získána z Slovak Malach Speech Corpusu. Základní jednotkou AM je trifón reprezentovaný 5ti stavovým HMM, kdekaždý stav je modelován 16ti složkovým GMM. Aplikací fonetického shlukovacího stromu byl počet stavů snížen na 7902. Jazykový model je tvořen kombinací 2 bigramov

Classification

  • Type

    X - Unclassified

  • CEP classification

    JD - Use of computers, robotics and its application

  • OECD FORD branch

Result continuities

  • Project

    Result was created during the realization of more than one project. More information in the Projects tab.

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2006

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů