All
All

What are you looking for?

All
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Resource-light Morphological Analysis and Tagging

Project goals

html,body { border: 0px; }Morphological analyzers and taggers are essential for many computer applications ranging from web search to speech recognition and machine translation. However, they are very expensive and time-consuming to create.This project aims to develop a method for creating morphological taggers and analyzers on the basis of (i) resources available for a related language and (ii) a limited amount of high-impact, low-cost manually created resources. The goal is to achieve accuracy not significantly lower than that of the state-of-the-art systems but with only a fraction of cost, labor and (language-specific) linguistic expertise.

Keywords

morphological analysis morphological tagging

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Post-graduate (doctorate) grants

  • Call for proposals

    Postdoktorandské granty 10 (SGA02010GA1PD)

  • Main participants

  • Contest type

    VS - Public tender

  • Contract ID

    P406-10-P328

Alternative language

  • Project name in Czech

    Morfologická analýza a tagging s minimálními zdroji

  • Annotation in Czech

    html,body { border: 0px; }Morphologické analyzátory a taggery jsou nepostradatelné pro mnoho počítačových aplikací, počínaje internetovými vyhledávači přes rozpoznávání řeči až po strojový překlad. Tvorba kvalitních analyzátorů a taggerů je však finančněi časově velmi náročná.Cílem tohoto projektu je vyvinout metodu, která by umožnila vytvořit takové nástroje levně a rychle na základě (1) zdrojů dostupných pro příbuzný jazyk, doplněných (2) omezeným množstvím pečlivě vybraných ručně vytvořených dat. Přitom chceme dosáhnout úspěšnosti srovnatelné se systémy, které vznikly standardním způsobem, ale za zlomek ceny, času a s minimem lingvistických znalostí o daném jazyku.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

  • CEP - another secondary branch

  • 60201 - General language studies
    60202 - Specific languages
    60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project has met its objective, which was to research on possibilities of effective creation tools for morphological analysis and tagging of resource-poor languages on condition such tools are available for languages genetically close (e.g. Belarussian/Russian).

Solution timeline

  • Realization period - beginning

    Jan 1, 2010

  • Realization period - end

    Dec 31, 2012

  • Project status

    U - Finished project

  • Latest support payment

    Apr 1, 2012

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP13-GA0-GP-U/03:3

  • Data delivery date

    May 2, 2016

Finance

  • Total approved costs

    2,424 thou. CZK

  • Public financial support

    2,424 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK