Resource-light Morphological Analysis and Tagging
Project goals
html,body { border: 0px; }Morphological analyzers and taggers are essential for many computer applications ranging from web search to speech recognition and machine translation. However, they are very expensive and time-consuming to create.This project aims to develop a method for creating morphological taggers and analyzers on the basis of (i) resources available for a related language and (ii) a limited amount of high-impact, low-cost manually created resources. The goal is to achieve accuracy not significantly lower than that of the state-of-the-art systems but with only a fraction of cost, labor and (language-specific) linguistic expertise.
Keywords
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 10 (SGA02010GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-10-P328
Alternative language
Project name in Czech
Morfologická analýza a tagging s minimálními zdroji
Annotation in Czech
html,body { border: 0px; }Morphologické analyzátory a taggery jsou nepostradatelné pro mnoho počítačových aplikací, počínaje internetovými vyhledávači přes rozpoznávání řeči až po strojový překlad. Tvorba kvalitních analyzátorů a taggerů je však finančněi časově velmi náročná.Cílem tohoto projektu je vyvinout metodu, která by umožnila vytvořit takové nástroje levně a rychle na základě (1) zdrojů dostupných pro příbuzný jazyk, doplněných (2) omezeným množstvím pečlivě vybraných ručně vytvořených dat. Přitom chceme dosáhnout úspěšnosti srovnatelné se systémy, které vznikly standardním způsobem, ale za zlomek ceny, času a s minimem lingvistických znalostí o daném jazyku.
Scientific branches
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has met its objective, which was to research on possibilities of effective creation tools for morphological analysis and tagging of resource-poor languages on condition such tools are available for languages genetically close (e.g. Belarussian/Russian).
Solution timeline
Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2012
Project status
U - Finished project
Latest support payment
Apr 1, 2012
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP13-GA0-GP-U/03:3
Data delivery date
May 2, 2016
Finance
Total approved costs
2,424 thou. CZK
Public financial support
2,424 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
2 424 CZK thou.
Public support
2 424 CZK thou.
100%
Provider
Czech Science Foundation
CEP
AI - Linguistics
Solution period
01. 01. 2010 - 31. 12. 2012