Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Rozpoznávání řeči pro jazyky s omezeným množstvím trénovacích zdrojů

Cíle projektu

Projekt je zaměřen na rozpoznávání řeči v situacích, kdy je k dispozici málo trénovacích dat a omezené nebo žádné znalosti z lingvistiky a fonetiky cílového jazyka. V oblasti akustických modelů bude zkoumat moderní techniky representace parametrů GMM/HMMmodelů v pod-prostorech. Zaměří se také na automatickou tvorbu výslovnostních slovníků náhradou sekvencí fonémů za sekvence znaků nebo shluků akustických jednotek natrénovaných na datech. Nedílnou součástí projektu je ověřování na standardních datech aúčast v mezinárodních konferencích.

Klíčová slova

speechrecognitionmultilingualspeechrecognitionautomaticdictionarygenerationSGMM

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Postdoktorandské granty

  • Veřejná soutěž

    Postdoktorandské granty 12 (SGA02012GA1PD)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    P202-12-P604

Alternativní jazyk

  • Název projektu anglicky

    Speech recognition for low-resource languages

  • Anotace anglicky

    The project aims at speech recognition in situations, where little training data and limited or no knowledge of liguistic and phonetics of the target language are available. In the domain of acoustic models, we will investigate modern techniques of GMM/HMM parameter representations in sub-spaces. The project will also focus on unsupervised creation of pronunciation dictionaries where sequences of phonemes will be replaced by graphemes or clusters of acoustic unites trained on data. Important parts of the project are tests on standard data and participation in international evaluations.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    IN - Informatika

  • CEP - vedlejší obor

    JC - Počítačový hardware a software

  • CEP - další vedlejší obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD - odpovídající obory
    (dle převodníku)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
    20204 - Robotics and automatic control
    20205 - Automation and control systems
    20206 - Computer hardware and architecture

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    Řešitel dosáhl nových výsledků v oblasti rozpoznávání řeči s omezenými trénovacími multilingválními daty. Závěrečná karta projektu je adekvátní. Výsledky byly aplikovány např. pro výuku správných výslovností, přepis řeči a vyhledávání klíčových slov. Vý?

Termíny řešení

  • Zahájení řešení

    1. 1. 2012

  • Ukončení řešení

    31. 12. 2014

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    31. 3. 2014

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP15-GA0-GP-U/02:2

  • Datum dodání záznamu

    6. 5. 2016

Finance

  • Celkové uznané náklady

    1 551 tis. Kč

  • Výše podpory ze státního rozpočtu

    1 551 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

1 551 tis. Kč

Statní podpora

1 551 tis. Kč

100%


Poskytovatel

Grantová agentura České republiky

CEP

IN - Informatika

Doba řešení

01. 01. 2012 - 31. 12. 2014