Analýza a zpracování textu
Cíle projektu
S výsledky z výzkumu v oblasti vyhledávání v textu se setkávají denně všichni uživatelé počítačů používající textový editor nebo vyhledávající informace na Internetu. Výchozím bodem naší práce budou aktuální výsledky našeho výzkumu v oblasti vyhledávánía analýzy textu. V oblasti analýzy textu se nyní soustředíme na paralelní překlady, kde nejsou dosud známá ucelená řešení. Dosažené výsledky v oblasti vyhledávání se opírají o jednotný obecný pohled na všechny dosud známé druhy vyhledávacích problémů, což nám často umožňuje odhalit nové vlastnosti a algoritmy též pro další kategorie vyhledávacích problémů. Cíle našeho výzkumu lze rozdělit na ty, na jejichž řešení již pracujeme, a na problémy nové, vyvstávající z oblastí jako zpracování obrazu či analýzaDNA. Mezi řešené problémy patří např.: LL a LR syntaktická a paralelní syntaktická analýza; přesné a přibližné vyhledávání opakování v textu, vyhledávání v obrázcích, konstrukce a použití faktorových automatů (DAWG, CDAWG) a sufixových polí a
Klíčová slova
textparallel LL and LR analysisfinite automatonpattern matching automatonexactapproximate
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 9 (SGA02006GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
201/06/1039
Alternativní jazyk
Název projektu anglicky
Text processing and analysis
Anotace anglicky
Results of the pattern matching research are used everyday by all computer users that use a text editor or search on the Internet. The starting point for our work are our latest results in the area of a text processing and analysis. In the area of a textanalysis our current research is focused mainly on parallel translations, where there are no integrated solutions. Our solutions in the area of text processing use a unified model of all known pattern matching problems, therefore we can look at present algorithms from a different point of view and possibly find new ones. Goals of our research consist of the problems we work on and new problems arising from other research fields like image processing or DNA analysis. Now we work on: e.g. LL and LR syntactic and parallel syntactic analysis; searching for exact and approximate repetitions, 2D matching, construction and using factor automata (DAWG, CDAWG) and suffix arrays and searching in compressed texts. Problems we are willing to open: compiler
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Náš projekt se zabýval řadou zajímavých témat z oblasti zpracování textu. Výzkum v oblasti LL paralelní syntaktické analýzy vyústil v nalezení deterministického LLP* syntaktického analyzátoru. Podařilo se také najít třídy formálních překladů, jež mohou b
Termíny řešení
Zahájení řešení
1. 1. 2006
Ukončení řešení
31. 12. 2008
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
25. 4. 2008
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP09-GA0-GA-U/02:2
Datum dodání záznamu
22. 10. 2009
Finance
Celkové uznané náklady
1 494 tis. Kč
Výše podpory ze státního rozpočtu
1 494 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
1 494 tis. Kč
Statní podpora
1 494 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
IN - Informatika
Doba řešení
01. 01. 2006 - 31. 12. 2008