Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Tektogramatický popis jazyka pro rozpoznávání mluvené řeči a strojový překlad

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    Standardní projekty 9 (SGA02006GA-ST)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    405/06/0589

Alternativní jazyk

  • Název projektu anglicky

    Tectogrammatical Language Description for Speech Recognition and Machine Translation

  • Anotace anglicky

    Formal language description is a necessary prerequisite for applications of computational linguistics, such as machine translation and speech recognition. Functional Generative Description, a dependency-based, fully formal stratificational language description framework, describes patterns of natural language usage that can be learned, both by linguists and under suitable circumstances also automatically by machines. It has been implemented in the Prague Dependency Treebank, a syntactically parsed corpus of Czech, which has three annotation levels: morphology, surface syntax and tectogrammatics. The tectogrammatical level ("deep" syntactic analysis, a language-specific transitional level between the language system and its semantics) constitutes the core of the implementation of FGD. The primary goal of this project is to compare the tectogrammatical description of Czech and English on both written and spoken data. We expect the multiligual application of tectogrammatical language description to

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    AI - Jazykověda

  • CEP - vedlejší obor

    IN - Informatika

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    V rámci tohoto projektu byla vytvořena specifikace pro tektogramatickou (hloubkově-syntaktickou) formalizaci angličtiny, upravena obdobná specifikace pro češtinu a bylo podle nich manuálně anotováno 13000 (resp. 20000) anglických (resp. českých) vět z ko

Termíny řešení

  • Zahájení řešení

    1. 1. 2006

  • Ukončení řešení

    31. 12. 2008

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    25. 4. 2008

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP09-GA0-GA-U/02:2

  • Datum dodání záznamu

    22. 10. 2009

Finance

  • Celkové uznané náklady

    3 723 tis. Kč

  • Výše podpory ze státního rozpočtu

    3 723 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč