Anotovaný korpus polských výpovědí svědků holocaustu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000005" target="_blank" >RIV/49777513:23520/06:00000005 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Polish Malach Speech Corpus
Popis výsledku v původním jazyce
Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Polish collection is created by about 1,550 testimonies with the total length of about 3,500 hours. The corresponding Polish Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 200 15-minute speech segments of individual speakers (for training purposes) and whole testimonies of 10 different survivors (about 22 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.
Název v anglickém jazyce
Polish Malach Speech Corpus
Popis výsledku anglicky
Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Polish collection is created by about 1,550 testimonies with the total length of about 3,500 hours. The corresponding Polish Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 200 15-minute speech segments of individual speakers (for training purposes) and whole testimonies of 10 different survivors (about 22 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.
Klasifikace
Druh
X - Nezařazeno
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LC536" target="_blank" >LC536: Centrum komputační lingvistiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů