Vícejazyčná automatická detekce strukturálních událostí v mluvené řeči
Cíle projektu
Tento projekt má za cíl podpořit užší spolupráci Katedry kybernetiky FAV ZČU v Plzni se špičkovými pracovišti v USA, Human Language Technology Research Institute při University of Texas at Dallas a výzkumným institutem SRI International v oblasti automatického rozpoznávání řeči. Projekt je zaměřen na automatickou detekci ?strukturálních událostí? v mluvené řeči, která je klíčová pro umožnění následného automatického zpracování rozpoznaného textu. Mezi strukturální události v řeči patří hranice vět, ?neplynulosti? a další jevy, které nejsou standardně označeny v ?proudu slov?, který je výstupem konvenčních automatických rozpoznávačů řeči. Hlavním cílem spolupráce je vyvíjení metod pro automatickou detekci strukturálních událostí ve zvukových dokumentechve více různých jazycích, které se od sebe výrazně liší v syntaktické, fonetické i prozodické struktuře. Plánována je práce zejména na angličtině a češtině, počítá se ale i s rozšířením práce na arabštinu a mandarínskou čínštinu, příp. další jazyky.
Klíčová slova
automatic speech understandingautomatically recognized textaudio documentsArabicMandarinEnglish
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
KONTAKT
Veřejná soutěž
KONTAKT 5 (SMSM2007ME2)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
2783/2009-32
Alternativní jazyk
Název projektu anglicky
Multilingual Automatic Detection of Structural Events in Speech
Anotace anglicky
This project aims to support a closer cooperation between Department of Cybernetics, University of West Bohemia in Pilsen, the Human Language Technology Research Institute, University of Texas at Dallas, and SRI International, in the area of automatic speech understanding. In particular, the project is focused on automatic detection of structural events in speech, which is a key task for enabling downstream automatic processing of automatically recognized text. Structural events include sentence boundaries, disfluencies, and other phenomena that are currently not marked in the ?stream of words? output by conventional speech recognizers. The main goal is to develop methods for automatic detection of structural events in audio documents in different languages, including languages that differ significantly in phonetic, prosodic, and syntactic characteristics. We plan to mainly work on Czech and English, but we also plan to extend the work to Arabic and Mandarin, and eventually to other languages.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)20204 - Robotics and automatic control
20205 - Automation and control systems
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
V projektu byla vytvořena česká řečová databáze s anotací tzv. strukturálních metadat. Byl vyvinut automatický systém pro detekci konce věty v řeči. Úspěšnost systému byla analyzována z pohledu vlivu jazyka, žánru řeči a identity řečníka. Byla rozvíjena?
Termíny řešení
Zahájení řešení
1. 5. 2007
Ukončení řešení
31. 12. 2009
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
24. 2. 2009
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP10-MSM-ME-U/01:1
Datum dodání záznamu
30. 6. 2010
Finance
Celkové uznané náklady
822 tis. Kč
Výše podpory ze státního rozpočtu
742 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
80 tis. Kč
Základní informace
Uznané náklady
822 tis. Kč
Statní podpora
742 tis. Kč
90%
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
CEP
JD - Využití počítačů, robotika a její aplikace
Doba řešení
01. 05. 2007 - 31. 12. 2009