Selected derivational relations for automatic processing of Czech
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 12 (SGA02012GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
P406-12-P175
Alternative language
Project name in Czech
Vybrané derivační vztahy pro automatické zpracování češtiny
Annotation in Czech
V rámci navrhovaného projektu budou zkoumány vybrané slovotvorné vztahy v češtině, konkrétně vztahy mezi adjektivy a slovy od nich odvozenými. Podle významového vztahu k základovému adjektivu budou odvozená slova klasifikována jako syntaktické nebo lexikální deriváty. Syntaktický derivát vyjadřuje stejný lexikální význam jako slovo základové, liší se od něj pouze větněčlenskou funkcí; naopak lexikální derivát se liší významově a stává se samostatnou lexikální položkou ve slovníku. Na základě teoretických poznatků, k nimž dospějeme, bude navrženo anotační schéma reflektující derivační vztahy, toto schéma bude začleněno do hloubkově-syntaktické anotace Pražského závislostního korpusu (Prague Dependency Treebank, PDT) a uplatněno při anotaci dat, která mají být zahrnuta do nové verze PDT, pracovně nazývané PDT 3.0. Tento bohatě anotovaný korpus najde uplatnění jak při teoretickém jazykovědném výzkumu, tak v rámci automatického zpracování přirozeného jazyka (např. při strojovém překladu). V rámci projektubude rovněž budována XML databáze zpracovávaných adjektiv a jejich derivátů.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The project studying the Czech deadjectival derivation was concentrated on 1) Distinction between syntactic and lexical derivation; 2) Description of semantics of selected deadjectival suffixes; 3) Determination and comparison of productivity of deadjectival suffixes. The published outputs and databases document all results were reached. The final result enriches the Prague Dependency Treebank.
Solution timeline
Realization period - beginning
Jan 1, 2012
Realization period - end
Dec 31, 2014
Project status
U - Finished project
Latest support payment
Apr 18, 2014
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP15-GA0-GP-U/02:2
Data delivery date
May 6, 2016
Finance
Total approved costs
1,476 thou. CZK
Public financial support
1,476 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK