Pattern REcognition-based Statistically Enhanced MT
Cíle projektu
This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g.bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. It is intended to be of a hybrid nature, combining linguistic processing with the positive aspects of corpus-driven approaches, such as SMT and EBMT. In order for PRESEMT to be easily amenable to new language pairs, relatively inexp
Klíčová slova
machine translationpattern recognitionSMTlanguage-independen methodsyntactic phrase-based modellingevolutionary algorithms
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
Podpora projektů sedmého rámcového programu Evropského společenství pro výzkum, technologický rozvoj a demonstrace (2007 až 2013) podle zákona č. 171/2007 Sb.
Veřejná soutěž
FP7-ICT-2009-4
Hlavní účastníci
—
Druh soutěže
RP - Spolufinancování programu EK
Číslo smlouvy
1090/2011-321
Alternativní jazyk
Název projektu anglicky
Pattern REcognition-based Statistically Enhanced MT
Anotace anglicky
This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g.bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. It is intended to be of a hybrid nature, combining linguistic processing with the positive aspects of corpus-driven approaches, such as SMT and EBMT. In order for PRESEMT to be easily amenable to new language pairs, relatively inexp
Vědní obory
Kategorie VaV
AP - Aplikovaný výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
JD - Využití počítačů, robotika a její aplikace
CEP - další vedlejší obor
AI - Jazykověda
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
60201 - General language studies
60202 - Specific languages
60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Hodnocení výsledků řešení ministerstvo neprovádí, neboť podmínkou podpory je, že uchazeč byl vybrán mezinárodním poskytovatelem v souladu s pravidly příslušného programu. Projekt je hodnocen až po jeho schválení mezinárodním poskytovatelem.
Termíny řešení
Zahájení řešení
1. 1. 2010
Ukončení řešení
31. 12. 2012
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
18. 4. 2012
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP13-MSM-7E-U/01:1
Datum dodání záznamu
28. 6. 2013
Finance
Celkové uznané náklady
1 484 tis. Kč
Výše podpory ze státního rozpočtu
1 484 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
1 484 tis. Kč
Statní podpora
1 484 tis. Kč
100%
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
CEP
IN - Informatika
Doba řešení
01. 01. 2010 - 31. 12. 2012