Corpus Annotation as a Feasible and Scientifically Beneficial Task
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3A10456903" target="_blank" >RIV/00216208:11320/22:10456903 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.degruyter.com/document/doi/10.1515/9783110767377-024/html" target="_blank" >https://www.degruyter.com/document/doi/10.1515/9783110767377-024/html</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1515/9783110767377-024" target="_blank" >10.1515/9783110767377-024</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Corpus Annotation as a Feasible and Scientifically Beneficial Task
Popis výsledku v původním jazyce
The aim of the present chapter is to demonstrate that a well-designed and theoretically founded corpus annotation contributes significantly to the use of the corpus for testing a linguistic theory and its further development. The data for our analyses come from the Prague Dependency Treebank family both monolingual Czech and parallel English-Czech and concern the underlying syntactic level of language description and the annotation of discourse structure. In particular, the case studies concern three research questions, namely (i) the semantic relevance of information structure of the sentence, (ii) the relation between focus sensitive particles and discourse connectives with respect to the semantics of discourse relations, and (iii) the relation between primary and secondary connectives. In the Appendix, some data on measuring inter-annotator agreement are presented and discussed.
Název v anglickém jazyce
Corpus Annotation as a Feasible and Scientifically Beneficial Task
Popis výsledku anglicky
The aim of the present chapter is to demonstrate that a well-designed and theoretically founded corpus annotation contributes significantly to the use of the corpus for testing a linguistic theory and its further development. The data for our analyses come from the Prague Dependency Treebank family both monolingual Czech and parallel English-Czech and concern the underlying syntactic level of language description and the annotation of discourse structure. In particular, the case studies concern three research questions, namely (i) the semantic relevance of information structure of the sentence, (ii) the relation between focus sensitive particles and discourse connectives with respect to the semantics of discourse relations, and (iii) the relation between primary and secondary connectives. In the Appendix, some data on measuring inter-annotator agreement are presented and discussed.
Klasifikace
Druh
C - Kapitola v odborné knize
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA20-09853S" target="_blank" >GA20-09853S: Globální koherence českých textů a možnosti jejího korpusového zpracování</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název knihy nebo sborníku
CLARIN: The Infrastructure for Language Resources
ISBN
978-3-11-076734-6
Počet stran výsledku
34
Strana od-do
613-646
Počet stran knihy
820
Název nakladatele
Walter de Gruyter GmbH, Berlin/Boston
Místo vydání
Mannheim, Germany
Kód UT WoS kapitoly
—