Akustický a jazykový model spontánní češtiny

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000004" target="_blank" >RIV/49777513:23520/05:00000004 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/49777513:23520/05:00000001
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Czech Spontaneaous Speech – Acoustic&Language Models (MALACH)
Popis výsledku v původním jazyce
The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 570 Czech testimonies with a total length of 1 200 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Czech Malach Speech Corpus. The basic AM unit is atriphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6699 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.
Název v anglickém jazyce
Czech Spontaneaous Speech – Acoustic&Language Models (MALACH)
Popis výsledku anglicky
The Visual History Foundation collected recently about 52 thousand testimonies of Holocaust survivors pronounced in 32 languages. There are approx. 570 Czech testimonies with a total length of 1 200 hours. It is not feasible to transcribe all those testimonies maually due to the enornous time and money demands. Thus the transcription is performed using the automatic speech recognition system – data forthe system development were acquired from the Czech Malach Speech Corpus. The basic AM unit is atriphone represented by a 5-state HMM, where every state is modeled as a GMM with 16 mixtures. The total number of states was reduced to 6699 using a phonetic clustering tree. The language model is designed as a combination of 2 bigram models.

Klasifikace

Druh
X - Nezařazeno
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—

Návaznosti výsledku

Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2005
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Podobné výsledky(10)

Akustický a jazykový model spontánní slovenštiny Akustický a jazykový model spontánní ruštiny Anotovaný korpus polských výpovědí svědků holocaustu

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Akustický a jazykový model spontánní češtiny

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Podobné výsledky(10)