Czech in the Machine Translation Era (CZECHMATE)
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 14 (SGA02011GA-ST)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-11-1499
Alternative language
Project name in Czech
Čeština ve věku strojového překladu
Annotation in Czech
V oblasti počítačového zpracování je čeština rozvinutý jazyk s bohatými datovými i nástrojovými zdroji. Bohužel však stále zaostává v kvalitě strojového překladu. Dosud probíhající výzkum se zaměřoval převážně na překlad pomocí hloubkové lingvistické analýzy. Frázový překlad, který je ve světě momentálně nejúspěšnější, zůstával stranou, částečně i proto, že ho kvůli odlišným vlastnostem nelze na tento jazyk aplikovat přímočaře bez příslušné adaptace. Cílem tohoto projektu je adaptovat existující frázovýpřekladač na překlad z angličtiny a dvou dalších jazyků a dosáhnout přijatelné kvality překladu. Samostatně studován bude překlad pojmenovaných entit. Bude vytvořena internetová aplikace pro překlad webových stránek. V rámci projektu bude také pořízenoněkolik referenčních překladů testovacích textů pro účely ověřování úspěšnosti automatického překladu.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
JD - Use of computers, robotics and its application
CEP - another secondary branch
JC - Computer hardware and software
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>20206 - Computer hardware and architecture<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has achieved a high international standard. Its results are presented well and can be easily applied in professional practice. It contributed to the education of undergraduate students. In addition to publications, an important output is thenew data set - multiple reference translations from English, German, Spanish and French to Czech, now available for research purposes for free.
Solution timeline
Realization period - beginning
Jan 1, 2011
Realization period - end
Dec 31, 2013
Project status
U - Finished project
Latest support payment
Jun 12, 2013
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP14-GA0-GA-U/01:1
Data delivery date
Jul 1, 2014
Finance
Total approved costs
3,491 thou. CZK
Public financial support
3,491 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK