Combining Phrase-Based and Deep-Syntactic Machine Translation
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 10 (SGA02010GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-10-P259
Alternative language
Project name in Czech
Hybridní frázový a hloubkově-syntaktický strojový překlad
Annotation in Czech
Cílem projektu je studovat kombinace frázového a hloubkově-syntaktického strojového překladu, tak abychom využili komplementárních výhod obou přístupů. Frázový překlad dobře pracuje v případech, kdy máme trénovací data přímo z překládané domény, přesto však na delších větách poskytuje poměrně často nekoherentní výstup: delší věty nedávají smysl nebo např. postrádají sloveso. Hloubkový překlad slibuje lepší gramatičnost výstupu i možnost zobecnění, přesto se v dosavadních projektech nepodařilo dosáhnoutvýstupní kvality frázového překladu.Navrhovaný projekt kromě empirického posouzení využitelnosti pevně daných trénovacích dat pro překlad daného textu frázovou a hloubkově-syntaktickou metodou implementuje dva hybridní systémy: 1) budování cílového syntaktického stromu na základě jak hloubkového rozboru, tak i prosté posloupnosti slov vstupní věty, a 2) prohledávání kombinovaného stavového prostoru hypotéz obsahujících jak frázové, tak hloubkově-syntaktické prvky. Výsledky shrneme v ucelené zprávě.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
IN - Informatics
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The project has reached its objective to research on combination of the symbolic and the statistical approaches to machine translation, resulted in a number of publications and pointed out new possibilities of approaches to machine translation.
Solution timeline
Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2012
Project status
U - Finished project
Latest support payment
Apr 1, 2012
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP13-GA0-GP-U/03:3
Data delivery date
May 2, 2016
Finance
Total approved costs
1,931 thou. CZK
Public financial support
1,931 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK