Grammar-based treebank of Czech
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 17 (SGA0201300005)
Main participants
Univerzita Karlova / Filozofická fakulta
Contest type
VS - Public tender
Contract ID
13-27184S
Alternative language
Project name in Czech
Treebank češtiny na základě gramatiky
Annotation in Czech
Tento matematicko-lingvistický projekt se zaměřuje na vytvoření formální gramatiky zachycující povrchovou syntax češtiny a na podstatné zkvalitnění plně automatické syntaktické analýzy češtiny. Prostřednictvím řady vylepšených softwarových nástrojů (morfologický analyzátor, automatické programy pro morfologickou anotaci - taggery, syntaktické analyzátory) se vytvoří syntaktická struktura vstupní české věty. Tuto strukturu bude možné různým způsobem zobrazovat (například v podobě závislostní či složkové struktury, v různé míře podspecifikace apod.) a exportovat do různých formátů, a to i podle požadavků různých syntaktických teorií. Návrh gramatiky i softwarové nástroje se budou opírat o velké textové zdroje - korpusy současné češtiny shromážděné v Českém národním korpusu. Softwarové nástroje v souladu s gramatikou také tyto dosud jen morfologicky označkované korpusy syntakticky oanotují a vytvoří tak rozsáhlé syntakticky anotované korpusy - treebanky. Tento projekt je pokračováním projektu Syntaktická analýza českých korpusů.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project, focused on a formal grammar describing a surface syntactic structure of Czech, followed the research plan. Its goals were met, the results were published (one book, several articles, papers in conference proceedings); in addition, a syntactically annotated treebank has been built, however, it is not publically available yet. The research team conformed to the grant agency regulations.
Solution timeline
Realization period - beginning
Feb 1, 2013
Realization period - end
Nov 24, 2016
Project status
U - Finished project
Latest support payment
Apr 1, 2016
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP17-GA0-GA-U/03:1
Data delivery date
Jun 28, 2017
Finance
Total approved costs
4,883 thou. CZK
Public financial support
4,883 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK