Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Anotovaný korpus slovenských výpovědí svědků holocaustu

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000039" target="_blank" >RIV/49777513:23520/06:00000039 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/49777513:23520/06:00000005

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Slovak Malach Speech Corpus

  • Popis výsledku v původním jazyce

    Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Slovak collection is created by about 580 testimonies with the total length of about 1,300 hours. The corresponding Slovak Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 400 15-minute speech segments of individual speakers (for trainingpurposes) and whole testimonies of 10 different survivors (about 22 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.

  • Název v anglickém jazyce

    Slovak Malach Speech Corpus

  • Popis výsledku anglicky

    Visual History Foundation collected recently at least 52 thousand testimonies of holocaust survivors pronounced at 32 different languages. The Slovak collection is created by about 580 testimonies with the total length of about 1,300 hours. The corresponding Slovak Malach Speech Corpus was annotated with the goal to build the large vocabulary continuous speech recognition system. For this purpose it was selected and manually transcribed 400 15-minute speech segments of individual speakers (for trainingpurposes) and whole testimonies of 10 different survivors (about 22 hours of speech) for tests. All manual annotations were performed in the orthographic form of the words.

Klasifikace

  • Druh

    X - Nezařazeno

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2006

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů