Čeština ve věku strojového překladu
Cíle projektu
V oblasti počítačového zpracování je čeština rozvinutý jazyk s bohatými datovými i nástrojovými zdroji. Bohužel však stále zaostává v kvalitě strojového překladu. Dosud probíhající výzkum se zaměřoval převážně na překlad pomocí hloubkové lingvistické analýzy. Frázový překlad, který je ve světě momentálně nejúspěšnější, zůstával stranou, částečně i proto, že ho kvůli odlišným vlastnostem nelze na tento jazyk aplikovat přímočaře bez příslušné adaptace. Cílem tohoto projektu je adaptovat existující frázovýpřekladač na překlad z angličtiny a dvou dalších jazyků a dosáhnout přijatelné kvality překladu. Samostatně studován bude překlad pojmenovaných entit. Bude vytvořena internetová aplikace pro překlad webových stránek. V rámci projektu bude také pořízenoněkolik referenčních překladů testovacích textů pro účely ověřování úspěšnosti automatického překladu.
Klíčová slova
machinetranslationcomputationalprocessingnaturallanguageCzechphrase-basedtranslationnamedentities
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 14 (SGA02011GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P406-11-1499
Alternativní jazyk
Název projektu anglicky
Czech in the Machine Translation Era (CZECHMATE)
Anotace anglicky
Czech is a language rich on resources (both data and tools) for computerized processing. Unfortunately, it is still behind in the quality of machine translation. The research conducted so far was focused mostly on translation using deep linguistic analysis of text. Today's most successful approach, phrase-based translation, has not been used systematically, partially because it cannot be applied to Czech straghtforwardly without proper adaptation. The goal of the present project is to adapt an existingphrase-based translation tool for translation from English and two other languages to Czech, and to achieve acceptable quality of translation of texts. Separately studied will be translation of named entities. An on-line application will be created thatwill translate web pages. Several reference translations of test texts will be obtained to test the machine translation accuracy, and this test data will be a by-product of the project.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
JD - Využití počítačů, robotika a její aplikace
CEP - další vedlejší obor
JC - Počítačový hardware a software
OECD FORD - odpovídající obory
(dle převodníku)20204 - Robotics and automatic control
20205 - Automation and control systems
20206 - Computer hardware and architecture
60201 - General language studies
60202 - Specific languages
60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Po odborné stránce je projekt na vysoké mezinárodní úrovni. Výsledky jsou dobře charakterizovány. V projektu je přítomna velmi výrazně stránka aplikační, která je využitelná i v jiných oborech. Přispěl také k výchově studentů. Kromě četných publikací js?
Termíny řešení
Zahájení řešení
1. 1. 2011
Ukončení řešení
31. 12. 2013
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
12. 6. 2013
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP14-GA0-GA-U/01:1
Datum dodání záznamu
1. 7. 2014
Finance
Celkové uznané náklady
3 491 tis. Kč
Výše podpory ze státního rozpočtu
3 491 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
3 491 tis. Kč
Statní podpora
3 491 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
AI - Jazykověda
Doba řešení
01. 01. 2011 - 31. 12. 2013