Global Coherence of Czech Texts in the Corpus-Based Perspective
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
SGA0202000001
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
20-09853S
Alternative language
Project name in Czech
Globální koherence českých textů a možnosti jejího korpusového zpracování
Annotation in Czech
Projekt je zaměřen na teoretický výzkum a následné korpusové zachycení globální koherence v českých psaných textech. Analýza globální koherence je založena na hierarchické strukturaci nižších a vyšších textových jednotek (klauzí a vět na jedné straně a např. odstavců na druhé) a na existenci vztahů soudržnosti mezi těmito jednotkami na všech úrovních hierarchie. Předpokládá se také jediná spojitá reprezentace pro celý dokument. V průběhu projektu nejprve kriticky zhodnotíme nejznámější současné lingvistické rámce pro globální analýzu koherence a využijeme vlastních dlouhodobých zkušeností s popisem různých jazykových aspektů tzv. koherence lokální. Poté navrhneme vhodný scénář pro zachycení globální koherence korpusovými metodami a provedeme pilotní anotaci. Navrhované téma rozšiřuje směr vývoje výzkumu textových vztahů a koherence v ústavu žadatelky a kombinuje tyto výsledky s nejnovějšími poznatky v zahraničním bádání v této oblasti. Výsledky projektu budou využitelné jak v lingvistice, tak i pro širokou škálu jazykových technologií věnovaných automatizovanému zpracování textu.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
60203 - Linguistics
OECD FORD - secondary branch
—
OECD FORD - another secondary branch
—
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AI - Linguistics
Solution timeline
Realization period - beginning
Jan 1, 2020
Realization period - end
Jun 30, 2023
Project status
—
Latest support payment
Apr 1, 2023
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP24-GA0-GA-R
Data delivery date
May 21, 2024
Finance
Total approved costs
3,649 thou. CZK
Public financial support
3,607 thou. CZK
Other public sources
42 thou. CZK
Non public and foreign sources
0 thou. CZK