Anotovaný korpus ruských výpovědí svědků holocaustu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000020" target="_blank" >RIV/49777513:23520/05:00000020 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/49777513:23520/05:00000021
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Russian Malach Speech Corpus
Popis výsledku v původním jazyce
Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Russian collection is created by about 7 050 testimonies with the total length of about 16,000 hours. The corresponding Russian Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 400 15-minute speech segments of individual speakers (for training purposes) and whole testimonies of 10 different survivors (about 25 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.
Název v anglickém jazyce
Russian Malach Speech Corpus
Popis výsledku anglicky
Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Russian collection is created by about 7 050 testimonies with the total length of about 16,000 hours. The corresponding Russian Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 400 15-minute speech segments of individual speakers (for training purposes) and whole testimonies of 10 different survivors (about 25 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.
Klasifikace
Druh
X - Nezařazeno
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LC536" target="_blank" >LC536: Centrum komputační lingvistiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2005
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů