Formal representation of language structures
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
—
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
—
Contract ID
—
Alternative language
Project name in Czech
Formální reprezentace jazykových struktur
Annotation in Czech
Počítačové zpracování češtiny patří k nejaktuálnějším úkolům současné české lingvistiky a předpokládá, že bude specifikována reprezentace jazykových struktur, na které budou převáděny české věty (ze vstupních textů, z dotazů uživatelů aplikovaných systémů apod.) a ze kterých budou syntetizovány věty (texty) výstupní (odpovědi na zadané dotazy, resumé, abstrakta, texty přeložené z jiného jazyka apod.). Tyto reprezentace musí být formálně korektní, úsporné a transparentní z hlediska interpretace, a zároveň musí jejich specifikace respektovat strukturní vlastnosti češtiny (stejně jako jiných indoevropských jazyků) a opírat se o široký empirický výzkum jazyka. Předpokládáme široké ověření získaného systému formální reprezentace na textech z nejrůznějších oborů pro zajištění zpětné vazby již v průběhu projektu. Počítačové analýze jazyka se dnes věnuje široká pozornost, katže třeba sledovat světový vývoj teoretického i apikačního výzkumu. K očekávaným přínosům patří zejména získání nové úrovně formálního po
Scientific branches
R&D category
—
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
AF - Documentation, librarianship, work with information
CEP - another secondary branch
BD - Information theory
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
V rámci projektu byl vytvořen tzv.Pražský závislostní korpus, obsahující 30 000 běžných českých vět označkovaných na morfologické a analytické rovině. Výsledky projektu jsou pro další počítačové zpracování češtiny velmi významné. Mají mezinárodní paramet
Solution timeline
Realization period - beginning
Jan 1, 1996
Realization period - end
Jan 1, 1998
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/1999/GA0/GA09GA/V/6:6
Data delivery date
—
Finance
Total approved costs
3,240 thou. CZK
Public financial support
1,734 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK