Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Analýza a zpracování textu

Cíle projektu

S výsledky z výzkumu v oblasti vyhledávání v textu se setkávají denně všichni uživatelé počítačů používající textový editor nebo vyhledávající informace na Internetu. Výchozím bodem naší práce budou aktuální výsledky našeho výzkumu v oblasti vyhledávánía analýzy textu. V oblasti analýzy textu se nyní soustředíme na paralelní překlady, kde nejsou dosud známá ucelená řešení. Dosažené výsledky v oblasti vyhledávání se opírají o jednotný obecný pohled na všechny dosud známé druhy vyhledávacích problémů, což nám často umožňuje odhalit nové vlastnosti a algoritmy též pro další kategorie vyhledávacích problémů. Cíle našeho výzkumu lze rozdělit na ty, na jejichž řešení již pracujeme, a na problémy nové, vyvstávající z oblastí jako zpracování obrazu či analýzaDNA. Mezi řešené problémy patří např.: LL a LR syntaktická a paralelní syntaktická analýza; přesné a přibližné vyhledávání opakování v textu, vyhledávání v obrázcích, konstrukce a použití faktorových automatů (DAWG, CDAWG) a sufixových polí a

Klíčová slova

textparallel LL and LR analysisfinite automatonpattern matching automatonexactapproximate

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    Standardní projekty 9 (SGA02006GA-ST)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    201/06/1039

Alternativní jazyk

  • Název projektu anglicky

    Text processing and analysis

  • Anotace anglicky

    Results of the pattern matching research are used everyday by all computer users that use a text editor or search on the Internet. The starting point for our work are our latest results in the area of a text processing and analysis. In the area of a textanalysis our current research is focused mainly on parallel translations, where there are no integrated solutions. Our solutions in the area of text processing use a unified model of all known pattern matching problems, therefore we can look at present algorithms from a different point of view and possibly find new ones. Goals of our research consist of the problems we work on and new problems arising from other research fields like image processing or DNA analysis. Now we work on: e.g. LL and LR syntactic and parallel syntactic analysis; searching for exact and approximate repetitions, 2D matching, construction and using factor automata (DAWG, CDAWG) and suffix arrays and searching in compressed texts. Problems we are willing to open: compiler

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    IN - Informatika

  • CEP - vedlejší obor

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory
    (dle převodníku)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    Náš projekt se zabýval řadou zajímavých témat z oblasti zpracování textu. Výzkum v oblasti LL paralelní syntaktické analýzy vyústil v nalezení deterministického LLP* syntaktického analyzátoru. Podařilo se také najít třídy formálních překladů, jež mohou b

Termíny řešení

  • Zahájení řešení

    1. 1. 2006

  • Ukončení řešení

    31. 12. 2008

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    25. 4. 2008

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP09-GA0-GA-U/02:2

  • Datum dodání záznamu

    22. 10. 2009

Finance

  • Celkové uznané náklady

    1 494 tis. Kč

  • Výše podpory ze státního rozpočtu

    1 494 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

1 494 tis. Kč

Statní podpora

1 494 tis. Kč

100%


Poskytovatel

Grantová agentura České republiky

CEP

IN - Informatika

Doba řešení

01. 01. 2006 - 31. 12. 2008