Exploring the Core and Limits of Czech Grammar as seen through the Czech National Corpus
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 2 (SGA02003GA-ST)
Main participants
Ústav pro jazyk český AV ČR, v. v. i.
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
Možnosti a meze gramatiky češtiny ve světle Českého národního korpusu
Annotation in Czech
Záměrem projektu je vytyčit první kontury principiálně nového gramatického popisu češtiny, založeného na gramatické analýze velkých a žánrově reprezentativních počítačových korpusů textů. Projekt je koncipován primárně jako strukturovaný týmový výzkumtypických monopolních i konkurenčních, včetně periferních gramatických forem a struktur soudobé češtiny vzhledem k tomu, jak jsou či nejsou obsaženy v Českém národním korpusu, a to v jeho centrální a největší složce, nazvané SYN 2000 (dále ČNK),obsahující vsoučasnosti 100 milionů slovních forem, a v Pražském závislostním korpusu. Konkrétně patří k záměru projektu na bázi ČNK: (a) evidovat problémové jevy velmi či značně frekventované, které navzdory tomu nebyly dosud v gramatikách představenybuď vůbec, anebo jen neúplně či nahodile; (b) evidovat i jevy málo frekventované, mezní a řídké nebo sporné, jejichž popis dosud buď zcela schází, anebo je neúplný, nahodilý či mylný vzhledem k tomu, že - ve srovnání s nynějšími možnostmi - vycházel z
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
One of the primary goals of the project was to encourage and initiate collective research on the grammar of contemporary Czech through large electronic text corpora. For Czech, this primarily means the Czech National Corpus and its primary component, ca
Solution timeline
Realization period - beginning
Jan 1, 2003
Realization period - end
Jan 1, 2005
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP06-GA0-GA-U/07:6
Data delivery date
Jan 15, 2009
Finance
Total approved costs
2,917 thou. CZK
Public financial support
2,917 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK