Building and using corpora of non-native Czech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F16%3A10336376" target="_blank" >RIV/00216208:11210/16:10336376 - isvavai.cz</a>
Výsledek na webu
<a href="http://ceur-ws.org/Vol-1649/80.pdf" target="_blank" >http://ceur-ws.org/Vol-1649/80.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Building and using corpora of non-native Czech
Popis výsledku v původním jazyce
Investigating language acquisition by non-native learners helps to understand important linguistic issues and to develop teaching methods, better suited both to the specific target language and to the learner. These tasks can now be based on empirical evidence from learner corpora including Czech. They are equipped with morphological and syntactic annotation, together with the detection and categorization of non-standard linguistic phenomena. After an overview of existing resources we propose solutions to several issues inherent to the process of compiling, annotating and using such corpora, including automatic identification of errors, design and application of error taxonomy, and user-friendly search tool. Finally, we deal with the question to what extent resources and tools available for standard language can be applied to the language of non-native learners.
Název v anglickém jazyce
Building and using corpora of non-native Czech
Popis výsledku anglicky
Investigating language acquisition by non-native learners helps to understand important linguistic issues and to develop teaching methods, better suited both to the specific target language and to the learner. These tasks can now be based on empirical evidence from learner corpora including Czech. They are equipped with morphological and syntactic annotation, together with the detection and categorization of non-standard linguistic phenomena. After an overview of existing resources we propose solutions to several issues inherent to the process of compiling, annotating and using such corpora, including automatic identification of errors, design and application of error taxonomy, and user-friendly search tool. Finally, we deal with the question to what extent resources and tools available for standard language can be applied to the language of non-native learners.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-10185S" target="_blank" >GA16-10185S: Čeština nerodilých mluvčích z pohledu teoretického a komputačního</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
ITAT 2016: Information Technologies—Applications and Theory (Proceedings)
ISBN
978-1-5370-1674-0
ISSN
1613-0073
e-ISSN
—
Počet stran výsledku
8
Strana od-do
80-87
Název nakladatele
CreateSpace Independent Publishing Platform – CEUR Workshop Proceedings
Místo vydání
Bratislava
Místo konání akce
Tatanské Matliare
Datum konání akce
15. 9. 2016
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—