Rozpoznávání řeči pro jazyky s omezeným množstvím trénovacích zdrojů
Cíle projektu
Projekt je zaměřen na rozpoznávání řeči v situacích, kdy je k dispozici málo trénovacích dat a omezené nebo žádné znalosti z lingvistiky a fonetiky cílového jazyka. V oblasti akustických modelů bude zkoumat moderní techniky representace parametrů GMM/HMMmodelů v pod-prostorech. Zaměří se také na automatickou tvorbu výslovnostních slovníků náhradou sekvencí fonémů za sekvence znaků nebo shluků akustických jednotek natrénovaných na datech. Nedílnou součástí projektu je ověřování na standardních datech aúčast v mezinárodních konferencích.
Klíčová slova
speechrecognitionmultilingualspeechrecognitionautomaticdictionarygenerationSGMM
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Postdoktorandské granty
Veřejná soutěž
Postdoktorandské granty 12 (SGA02012GA1PD)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P202-12-P604
Alternativní jazyk
Název projektu anglicky
Speech recognition for low-resource languages
Anotace anglicky
The project aims at speech recognition in situations, where little training data and limited or no knowledge of liguistic and phonetics of the target language are available. In the domain of acoustic models, we will investigate modern techniques of GMM/HMM parameter representations in sub-spaces. The project will also focus on unsupervised creation of pronunciation dictionaries where sequences of phonemes will be replaced by graphemes or clusters of acoustic unites trained on data. Important parts of the project are tests on standard data and participation in international evaluations.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
JC - Počítačový hardware a software
CEP - další vedlejší obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
20206 - Computer hardware and architecture
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Řešitel dosáhl nových výsledků v oblasti rozpoznávání řeči s omezenými trénovacími multilingválními daty. Závěrečná karta projektu je adekvátní. Výsledky byly aplikovány např. pro výuku správných výslovností, přepis řeči a vyhledávání klíčových slov. Vý?
Termíny řešení
Zahájení řešení
1. 1. 2012
Ukončení řešení
31. 12. 2014
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
31. 3. 2014
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP15-GA0-GP-U/02:2
Datum dodání záznamu
6. 5. 2016
Finance
Celkové uznané náklady
1 551 tis. Kč
Výše podpory ze státního rozpočtu
1 551 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
1 551 tis. Kč
Statní podpora
1 551 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
IN - Informatika
Doba řešení
01. 01. 2012 - 31. 12. 2014