Příprava řečového korpusu pro trénování klasifikátorů souvislé řeči v českém národním prostředí
Cíle projektu
Podstata navrhovaného postdoktorandského projektu se zaměřuje na řešení jedné problémové oblasti rozsáhlé a náročné problematiky navrhování systému pro automatické rozpoznávání souvislé řeči počítačem. Konkrétně by řešení postdoktorandského grantu mělo být orientováno na přípravu rozsáhlého, elektronicky označkovaného a foneticky vyváženého "řečového korpusu" pro české národní prostředí, který by umožňoval následné modelování "obecného" řečníka s využitím skrytých Markovových modelů. Navrhovaný projektsystematicky navazuje a dobře funkčně doplňuje komplexní projekt GA ČR reg. č. 102/96/K87 "Teorie a aplikace hlasové komunikace v češtině", který se řeší na pracovišti navrhovatele/garanta a který je zaměřen (v prvním tříletém období) na rozpracování některých komponent zmíněného systému. Se zahájením sběru rozsáhlejšího souboru řečových dat a jejich úpravou pro trénování modelu řečníka se přitom počítalo až v následující etapě komplexního projektu. Vzhledem k náročnosti přípravy "řečového korpusu" v
Klíčová slova
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
—
Hlavní účastníci
Západočeská univerzita v Plzni / Fakulta aplikovaných věd
Druh soutěže
—
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
The corpus for continuous speech recognition in Czech
Anotace anglicky
The proposed post-doctoral grant is aimed to the solution of one of the problems that have to be solved when an automatic continuous speech recognition system is developed. The concrete goal of the project is to design an extensive, automatically labelled and phonetically balanced Czech speech corpus which could be used to model a "common" speaker by means of hidden Markov models. The proposed project systematically follows up and complements the project GAČR n 102/96/K087 "Theory and Application of Speech Communication in Czech" that is solved at the department where the applicant works and that is aimed to the development of the above mentioned speech recognition system.
Vědní obory
Kategorie VaV
—
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
BD - Teorie informace
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10102 - Applied mathematics
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Výsledek řešení projektu je adekvátní plánovanému cíli, výstupy projektu byly prezentovány na 5 mezinárodních sympoziích. V čerpání prostředků došlo oproti plánu k přerozdělení, které lze tolerovat.
Termíny řešení
Zahájení řešení
1. 1. 1998
Ukončení řešení
1. 1. 2000
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP/2001/GA0/GA01GA/U/N/9:4
Datum dodání záznamu
—
Finance
Celkové uznané náklady
563 tis. Kč
Výše podpory ze státního rozpočtu
505 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
563 tis. Kč
Statní podpora
505 tis. Kč
89%
Poskytovatel
Grantová agentura České republiky
CEP
JD - Využití počítačů, robotika a její aplikace
Doba řešení
01. 01. 1998 - 01. 01. 2000