Non-native Czech from the Theoretical and Computational Perspective
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 20 (SGA0201600001)
Main participants
Univerzita Karlova / Filozofická fakulta
Contest type
VS - Public tender
Contract ID
16-10185S
Alternative language
Project name in Czech
Čeština nerodilých mluvčích z pohledu teoretického a komputačního
Annotation in Czech
Výzkum češtiny jako jazyka nerodilých mluvčích je důležitý z mnoha teoretických i praktických důvodů. Většina z nich je dána tím, že systematických studií na toto téma je málo, hlavně ve srovnání s jinými jazyky, jako je angličtina nebo němčina, a ovšem i ve srovnání s češtinou rodilých mluvčích. Jedním z důsledků jsou pak slabé metodologické základy celého oboru – pohled na češtinu nerodilých mluvčích jako na dynamický systém vývojových stádií si například dosud nenašel cestu do lingvistické teorie a praxe. Cílem tohoto projektu je vytvořit (1) teoretický popis a analýzu morfologie a morfosyntaxe češtiny nerodilých mluvčích, včetně taxonomie slovních forem podle více hledisek, (2) komputační modely češtiny nerodilých mluvčích, kombinující metody založené na pravidlech s metodami pravděpodobnostními, a (3) pilotní korpus textů, anotovaný kategoriemi z navržené taxonomie. Výsledky pomohou lépe porozumět procesu učení flektivního jazyka a vytvořit nástroje a zdroje, zaměřené na češtinu nerodilých mluvčích, včetně moderních výukových metod a materiálů.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project brought interesting results that prove to be relevant at the international level. Researchers built an corpus of non-native Czech and designed a multi-domain tagset annotation of errors. Published outputs are numerous (13 papers), however, compared to the planned outputs, the article in the impacted magazine is missing.
Solution timeline
Realization period - beginning
Jan 1, 2016
Realization period - end
Dec 11, 2020
Project status
U - Finished project
Latest support payment
Apr 26, 2018
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP21-GA0-GA-U/01:1
Data delivery date
Apr 12, 2021
Finance
Total approved costs
2,955 thou. CZK
Public financial support
2,955 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK