Computational Linguistics: Explicit description of language and annotated data focused on Czech
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 13 (SGA02010GA-ST)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-10-0875
Alternative language
Project name in Czech
Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu
Annotation in Czech
V Centru komputační lingvistiky při MFF UK (2000-2005, 2005-2009) byl vytvořen bohatě syntakticky anotovaný anotovaný korpus češtiny (PDT 2.0), který bude sloužit v navrhovaném projektu jako zdroj teoretického lingvistického výzkumu směřujícího k aplikacím v oblasti automatického zpracování jazyka.Výzkum bude probíhat v těchto směrech: (a) hlubší zkoumání vztahu formy a funkce, (b) přechod od syntaxe věty k mezivětným vztahům, (c) zkoumání vztahů mezi hloubkovou syntaxí a kognitivním obsahem a (d) výzkum specifických jevů mluveného jazyka na všech úrovních popisu. Prioritou budou jevy, které dosud v explicitním popisu zacyceny nebyly nebo jejichž zachycení nedává uspokojivé výsledky. Výzkum je zaměřen především na češtinu a angličtinu. Kromě teoretických publikací bude výsledkem projektu obohacené anotační schéma pro zpracovávané jazyky a na základě tohoto schématu rozšířený Pražský závislostní korpus (pro češtinu, angličtinu a mluvený jazyk). Rozšířené korpusy budou sloužit jak pro lingvistický výzkum, tak pro zlepšení metod užívaných pro automatickou analýzu a syntézu jazyka.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has achieved a high international standard. Its results are well presented. It contributes to theoretical knowledge of language and this can be easily applied in professional practice. In addition to publications, an output of the project isannotated corpuses of Czech. Regarding publications, however, most of them represent brief articles in proceedings.
Solution timeline
Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2013
Project status
U - Finished project
Latest support payment
Jun 12, 2013
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP14-GA0-GA-U/01:1
Data delivery date
Jul 1, 2014
Finance
Total approved costs
15,858 thou. CZK
Public financial support
15,858 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK