Syntactic annotation of Czech corpora
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 13 (SGA02010GA-ST)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-10-0434
Alternative language
Project name in Czech
Syntaktická anotace českých korpusů
Annotation in Czech
Projekt si klade za cíl vytvořit sadu nástrojů, s jejichž pomocí bude možné syntakticky anotovat korpusy současné češtiny. V současné době existují nástroje na morfologické značkování, které již byly využity pro označkování Českého národního korpusu. Existuje i několik systémů syntaktické analýzy češtiny, které jsou však příliš teoreticky zatížené, a jejich výsledky nejsou proto vhodné pro značkování korpusů určených široké odborné i laické veřejnosti. Navíc jejich úspěšnost není dost vysoká na to, abyumožňovaly plně automatické zpracování textů. Předkládaný projekt počítá s využitím všech zmíněných existujících nástrojů a předpokládá nižší procento chyb po převodu výsledků do teoreticky neutrálnějšího formátu (odpovídajícího šmilauerovské teorii vyučované na školách). Dále předpokládá vytvoření sady nástrojů pro opravování chyb a úplné syntaktické označkování pokusného korpusu o velikosti cca 1 mil. slov.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has reached its objective which was to set up a method for highly reliable tagging of Czech corpora.
Solution timeline
Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2012
Project status
U - Finished project
Latest support payment
Apr 1, 2012
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP13-GA0-GA-U/02:3
Data delivery date
May 17, 2016
Finance
Total approved costs
5,497 thou. CZK
Public financial support
5,497 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK