All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Global Coherence of Czech Texts in the Corpus-Based Perspective

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    SGA0202000001

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    20-09853S

Alternative language

  • Project name in Czech

    Globální koherence českých textů a možnosti jejího korpusového zpracování

  • Annotation in Czech

    Projekt je zaměřen na teoretický výzkum a následné korpusové zachycení globální koherence v českých psaných textech. Analýza globální koherence je založena na hierarchické strukturaci nižších a vyšších textových jednotek (klauzí a vět na jedné straně a např. odstavců na druhé) a na existenci vztahů soudržnosti mezi těmito jednotkami na všech úrovních hierarchie. Předpokládá se také jediná spojitá reprezentace pro celý dokument. V průběhu projektu nejprve kriticky zhodnotíme nejznámější současné lingvistické rámce pro globální analýzu koherence a využijeme vlastních dlouhodobých zkušeností s popisem různých jazykových aspektů tzv. koherence lokální. Poté navrhneme vhodný scénář pro zachycení globální koherence korpusovými metodami a provedeme pilotní anotaci. Navrhované téma rozšiřuje směr vývoje výzkumu textových vztahů a koherence v ústavu žadatelky a kombinuje tyto výsledky s nejnovějšími poznatky v zahraničním bádání v této oblasti. Výsledky projektu budou využitelné jak v lingvistice, tak i pro širokou škálu jazykových technologií věnovaných automatizovanému zpracování textu.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    60203 - Linguistics

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AI - Linguistics

Solution timeline

  • Realization period - beginning

    Jan 1, 2020

  • Realization period - end

    Jun 30, 2023

  • Project status

  • Latest support payment

    Apr 1, 2023

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP24-GA0-GA-R

  • Data delivery date

    May 21, 2024

Finance

  • Total approved costs

    3,649 thou. CZK

  • Public financial support

    3,607 thou. CZK

  • Other public sources

    42 thou. CZK

  • Non public and foreign sources

    0 thou. CZK