All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Centre of Computational Linguistics

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

  • Call for proposals

    SMSM0031008

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

Alternative language

  • Project name in Czech

    Centrum komputační lingvistiky

  • Annotation in Czech

    Centrum se bude věnovat výzkumu češtiny na docela nové úrovni, tj. na základě Českého závislostního korpusu, ve kterém už je k dispozici poloautomatická analýza desítek tisíc vět z textů různého druhu (vypracovaná v Laboratoři pro zprac. jazykových datpři ÚFAL MFF UK), na několika úrovních mluvnické stavby. Jde o výzkum teoretických i aplikačních aspektů komputační lingvistiky se zaměřením na češtinu v podobě psané i mluvené s využitím mimořádně rozsáhlých dat pro podrobný gramatický, sémantický alexikální rozbor a popis češtiny na základě strukturních a statistických postupů (matematické a výpočetní základy, metody a algoritmy komputační lingvistiky, metody učení z dat, stochastické i založené na pravidlech). Pozornost bude věnována i zpracovánívíce jazyků pro vyhled. informací ve vícejaz. textech a strojový překlad. Mezinárodní dlouhodobá spolupráce: John Hopkins Univ., Baltimore, Univ. of Pennsylvania, Phil., USA, univerzity v Hamburku, v Saarbrückenu, v Pise, v Edinburghu a INALCO v Paříži.

Scientific branches

  • R&D category

    NV - Nonindustrial research (Applied research excluded Industrial research)

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

    AF - Documentation, librarianship, work with information

  • CEP - another secondary branch

    BD - Information theory

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    The Center for Computational Linguistics has integrated human and technical resources for speech and language processing, developing databases, algorithms, and software tools for computer analysis and synthesis of Czech, English and other

Solution timeline

  • Realization period - beginning

    Jan 1, 2000

  • Realization period - end

    Jan 1, 2004

  • Project status

    U - Finished project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP/2005/MSM/MSM5LN/U/N/4:2

  • Data delivery date

    May 28, 2008

Finance

  • Total approved costs

    132,626 thou. CZK

  • Public financial support

    97,895 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    34,731 thou. CZK