Mezi slovníkem a gramatikou
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 20 (SGA0201600001)
Hlavní účastníci
Univerzita Karlova / Filozofická fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
16-07473S
Alternativní jazyk
Název projektu anglicky
Between lexicon and grammar
Anotace anglicky
A detailed typology of multiword expressions (MWE) in Czech and their typologically representative lexical database containing at least 7000 entries will be developed. The typology will be based on these criteria: (i) degree of fixedness (given by various quantitative characterictics) (ii) part-of-speech and morphological classification (iii) syntax, including word order: syntactic structure of MWEs, active/passive valency, syntactic transformability (such as passivization, topicalization, modification of MWE components); word order of MWE components: their adjacency and distance, scrambling (iv) semantics: (non)compositionality of the meaning of MWE components (v) lexical aspects: lexical functions, selectional restrictions. The database will contain as many MWE types as possible, based on the criteria above. The entries will be fit for integration into the syntactic structure in the existing format. Based on specific, already developed collocational measures and quantitative properties, MWEs will be extracted from the corpora of contemporary Czech in the Czech National Corpus.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Výsledkem projektu je vytvoření databáze víceslovných frazeologických jednotek a vyvinutí metod automatické anotace těchto jednotek v korpusu. Přínos lze spatřovat jak na úrovni teoretické (morfosyntaktické vlastnosti českých frazémů), tak na úrovni komputační (definování parametrů pro automatickou analýzu těchto jednotek). Výsledky výzkumu byly publikovány v zahraničních i českých časopisech.
Termíny řešení
Zahájení řešení
1. 1. 2016
Ukončení řešení
22. 7. 2020
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
26. 4. 2018
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP21-GA0-GA-U/01:1
Datum dodání záznamu
12. 4. 2021
Finance
Celkové uznané náklady
2 988 tis. Kč
Výše podpory ze státního rozpočtu
2 988 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč