Global Coherence of Czech Texts in the Corpus-Based Perspective

Project name in Czech
Globální koherence českých textů a možnosti jejího korpusového zpracování
Annotation in Czech
Projekt je zaměřen na teoretický výzkum a následné korpusové zachycení globální koherence v českých psaných textech. Analýza globální koherence je založena na hierarchické strukturaci nižších a vyšších textových jednotek (klauzí a vět na jedné straně a např. odstavců na druhé) a na existenci vztahů soudržnosti mezi těmito jednotkami na všech úrovních hierarchie. Předpokládá se také jediná spojitá reprezentace pro celý dokument. V průběhu projektu nejprve kriticky zhodnotíme nejznámější současné lingvistické rámce pro globální analýzu koherence a využijeme vlastních dlouhodobých zkušeností s popisem různých jazykových aspektů tzv. koherence lokální. Poté navrhneme vhodný scénář pro zachycení globální koherence korpusovými metodami a provedeme pilotní anotaci. Navrhované téma rozšiřuje směr vývoje výzkumu textových vztahů a koherence v ústavu žadatelky a kombinuje tyto výsledky s nejnovějšími poznatky v zahraničním bádání v této oblasti. Výsledky projektu budou využitelné jak v lingvistice, tak i pro širokou škálu jazykových technologií věnovaných automatizovanému zpracování textu.

R&D category
ZV - Basic research
OECD FORD - main branch
60203 - Linguistics
OECD FORD - secondary branch
—
OECD FORD - another secondary branch
—
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AI - Linguistics

Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP24-GA0-GA-R
Data delivery date
May 21, 2024

Similar projects(10)