All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Formal representation of language structures

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

  • Contract ID

Alternative language

  • Project name in Czech

    Formální reprezentace jazykových struktur

  • Annotation in Czech

    Počítačové zpracování češtiny patří k nejaktuálnějším úkolům současné české lingvistiky a předpokládá, že bude specifikována reprezentace jazykových struktur, na které budou převáděny české věty (ze vstupních textů, z dotazů uživatelů aplikovaných systémů apod.) a ze kterých budou syntetizovány věty (texty) výstupní (odpovědi na zadané dotazy, resumé, abstrakta, texty přeložené z jiného jazyka apod.). Tyto reprezentace musí být formálně korektní, úsporné a transparentní z hlediska interpretace, a zároveň musí jejich specifikace respektovat strukturní vlastnosti češtiny (stejně jako jiných indoevropských jazyků) a opírat se o široký empirický výzkum jazyka. Předpokládáme široké ověření získaného systému formální reprezentace na textech z nejrůznějších oborů pro zajištění zpětné vazby již v průběhu projektu. Počítačové analýze jazyka se dnes věnuje široká pozornost, katže třeba sledovat světový vývoj teoretického i apikačního výzkumu. K očekávaným přínosům patří zejména získání nové úrovně formálního po

Scientific branches

  • R&D category

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

    AF - Documentation, librarianship, work with information

  • CEP - another secondary branch

    BD - Information theory

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    V rámci projektu byl vytvořen tzv.Pražský závislostní korpus, obsahující 30 000 běžných českých vět označkovaných na morfologické a analytické rovině. Výsledky projektu jsou pro další počítačové zpracování češtiny velmi významné. Mají mezinárodní paramet

Solution timeline

  • Realization period - beginning

    Jan 1, 1996

  • Realization period - end

    Jan 1, 1998

  • Project status

    U - Finished project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP/1999/GA0/GA09GA/V/6:6

  • Data delivery date

Finance

  • Total approved costs

    3,240 thou. CZK

  • Public financial support

    1,734 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK