A learner corpus of Czech: current state and future directions
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F13%3A10194691" target="_blank" >RIV/00216208:11320/13:10194691 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216208:11210/13:10194691 RIV/46747885:24510/13:#0001080
Výsledek na webu
<a href="http://www.uclouvain.be/cluse.html" target="_blank" >http://www.uclouvain.be/cluse.html</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A learner corpus of Czech: current state and future directions
Popis výsledku v původním jazyce
The paper describes CzeSL, a learner corpus of Czech as a Second Language, together with its design properties. We start with a brief introduction of the project within the context of AKCES, a programme addressing Acquisition Corpora of Czech; in connection with the programme we are also concerned with the groups of respondents, including differences due to their L1; further we comment on the choice of the sociocultural metadata recorded with each text and related both to the learner and the text production task. Next we describe the intended uses of CzeSL. The core of the paper deals with transcription and annotation. We explain issues involved in the transcription of handwritten texts and present the concept of a multi-level annotation scheme including a taxonomy of captured errors. We conclude by mentioning results from an evaluation of the error annotation and presenting plans for future research.
Název v anglickém jazyce
A learner corpus of Czech: current state and future directions
Popis výsledku anglicky
The paper describes CzeSL, a learner corpus of Czech as a Second Language, together with its design properties. We start with a brief introduction of the project within the context of AKCES, a programme addressing Acquisition Corpora of Czech; in connection with the programme we are also concerned with the groups of respondents, including differences due to their L1; further we comment on the choice of the sociocultural metadata recorded with each text and related both to the learner and the text production task. Next we describe the intended uses of CzeSL. The core of the paper deals with transcription and annotation. We explain issues involved in the transcription of handwritten texts and present the concept of a multi-level annotation scheme including a taxonomy of captured errors. We conclude by mentioning results from an evaluation of the error annotation and presenting plans for future research.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GPP406%2F10%2FP328" target="_blank" >GPP406/10/P328: Morfologická analýza a tagging s minimálními zdroji</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Twenty Years of Learner Corpus Research - Looking Back, Moving Ahead
ISBN
978-2-87558-199-0
ISSN
2034-6417
e-ISSN
—
Počet stran výsledku
12
Strana od-do
1-12
Název nakladatele
Presses universitaires de Louvain
Místo vydání
Louvain-la-Neuve, Belgium
Místo konání akce
Louvain-la-Neuve, Belgium
Datum konání akce
15. 9. 2011
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—