Hybridní frázový a hloubkově-syntaktický strojový překlad
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Postdoktorandské granty
Veřejná soutěž
Postdoktorandské granty 10 (SGA02010GA1PD)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P406-10-P259
Alternativní jazyk
Název projektu anglicky
Combining Phrase-Based and Deep-Syntactic Machine Translation
Anotace anglicky
The aim of the project is to examine combinations of phrase-based and deep-syntactic machine translation (MT) to gain from complementary strengths of both approaches. Phrase-based translation performs satisfactorily in known domains and on shorter sentences, longer sentences often lack coherent structure. Deep-syntactic MT promises to produce grammatical output and to allow for a better generalization of training data, yet none of the deep syntactic systems built so far matched the phrase-based benchmark.The proposed project will empirically analyze the extent to which some fixed training data are exploited by phrase-based and deep-syntactic methods and will implement two hybrid systems: 1) constructing target syntactic tree based on all layers of representation of the source sentence, and 2) search in a hybrid search space of hypotheses containing both phrase-based as well as deep-syntactic elements. The results will be described in a detailed report.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Projekt dosáhl cíle prozkoumat možnosti kombinace symbolického a statistického přístupu ke strojovému překladu, vyústil v řadu publikací (vč. knihy) a poukázal na možnosti nových přístupů k problematice.
Termíny řešení
Zahájení řešení
1. 1. 2010
Ukončení řešení
31. 12. 2012
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
1. 4. 2012
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP13-GA0-GP-U/03:3
Datum dodání záznamu
2. 5. 2016
Finance
Celkové uznané náklady
1 931 tis. Kč
Výše podpory ze státního rozpočtu
1 931 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč