Building LVCSR System for Transcription of Spontaneously Pronounced Russian Testimonies in the MALACH Project: Initial Steps and First Results
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000179" target="_blank" >RIV/49777513:23520/03:00000179 - isvavai.cz</a>
Alternative codes found
RIV/49777513:23520/03:00000180
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Building LVCSR System for Transcription of Spontaneously Pronounced Russian Testimonies in the MALACH Project: Initial Steps and First Results
Original language description
The MALACH project uses the world's largest digital archives of video oral histories collected by the Survivors of the Shoah Visual History Foundation (VHF) and attempts to access such archives by advancing the state-of-the-art in Automated Speech Recognition (ASR) and Information Retrieval (IR). This paper discusses the initial steps and the first results in building large vocabulary continuous speech recognition (LVCSR) system for transcription of Russian witnesses. Russian as the third language processed in the MALACH project (after English and Czech) brought new problems especially in the phonetic area. Although the most of the Russian testimonies were provided by native Russian survivors we have encountered many different accents in their speech caused by a territory where the survivors are living.
Czech name
Budování systému automatického rozpoznávání souvislé spontánní řeči pro přepis spontánně pronesených výpovědí ruských svědků holocaustu v projektu MALACH.
Czech description
Projekt MALACH využívá největší světový archiv videovýpovědí svědků holocaustu, které byly shromážděny v Shoah Visual History Foundation (VHF) a pokouší se přistoupit k tomuto archivu využitím nejnovějších poznatků z oblasti automatického rozpoznávání řeči a vyhledáváním informací. Článek diskutuje počáteční etapy a první výsledky řešení projektu při budouvání systému rozpoznávání souvislé spontánní řeči ruských svědků holocaustu.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/LN00A063" target="_blank" >LN00A063: Centre of Computational Linguistics</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2003
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Lecture Notes in Artificial Intelligence
ISSN
0302-9743
e-ISSN
—
Volume of the periodical
—
Issue of the periodical within the volume
—
Country of publishing house
DE - GERMANY
Number of pages
6
Pages from-to
327
UT code for WoS article
—
EID of the result in the Scopus database
—