Globální koherence českých textů a možnosti jejího korpusového zpracování
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202000001
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
20-09853S
Alternativní jazyk
Název projektu anglicky
Global Coherence of Czech Texts in the Corpus-Based Perspective
Anotace anglicky
The project aims at theoretical and corpus-based representation of global coherence in Czech written texts. Global coherence assumes a hierarchical representation of smaller (clauses, sentences) and larger text units (e.g. paragraphs) and existence of coherence relations between these units on all levels of the hierarchy. A single interconnected representation for the entire document is postulated, too. In the project, we first critically evaluate up-to-date linguistic frameworks for global coherence analysis, benefiting from our own long-term experience with describing various linguistic aspects of local coherence. Next, we will design a suitable scenario for representing global coherence with corpus methods and conduct a pilot annotation. The proposed topic combines and expands both the line of development of research on discourse and coherence at the applicant’s institute and recent advances in international discourse-oriented community. The outcomes of the project are relevant for linguists as well as for a wide range of language technologies devoted to automated text processing.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AI - Jazykověda
Termíny řešení
Zahájení řešení
1. 1. 2020
Ukončení řešení
30. 6. 2023
Poslední stav řešení
—
Poslední uvolnění podpory
1. 4. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-GA0-GA-R
Datum dodání záznamu
21. 5. 2024
Finance
Celkové uznané náklady
3 649 tis. Kč
Výše podpory ze státního rozpočtu
3 607 tis. Kč
Ostatní veřejné zdroje financování
42 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč