Tektogramatický popis jazyka pro rozpoznávání mluvené řeči a strojový překlad
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 9 (SGA02006GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
405/06/0589
Alternativní jazyk
Název projektu anglicky
Tectogrammatical Language Description for Speech Recognition and Machine Translation
Anotace anglicky
Formal language description is a necessary prerequisite for applications of computational linguistics, such as machine translation and speech recognition. Functional Generative Description, a dependency-based, fully formal stratificational language description framework, describes patterns of natural language usage that can be learned, both by linguists and under suitable circumstances also automatically by machines. It has been implemented in the Prague Dependency Treebank, a syntactically parsed corpus of Czech, which has three annotation levels: morphology, surface syntax and tectogrammatics. The tectogrammatical level ("deep" syntactic analysis, a language-specific transitional level between the language system and its semantics) constitutes the core of the implementation of FGD. The primary goal of this project is to compare the tectogrammatical description of Czech and English on both written and spoken data. We expect the multiligual application of tectogrammatical language description to
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
V rámci tohoto projektu byla vytvořena specifikace pro tektogramatickou (hloubkově-syntaktickou) formalizaci angličtiny, upravena obdobná specifikace pro češtinu a bylo podle nich manuálně anotováno 13000 (resp. 20000) anglických (resp. českých) vět z ko
Termíny řešení
Zahájení řešení
1. 1. 2006
Ukončení řešení
31. 12. 2008
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
25. 4. 2008
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP09-GA0-GA-U/02:2
Datum dodání záznamu
22. 10. 2009
Finance
Celkové uznané náklady
3 723 tis. Kč
Výše podpory ze státního rozpočtu
3 723 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč