The MERLIN corpus: Learner language and the CEFR
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F14%3A10289365" target="_blank" >RIV/00216208:11320/14:10289365 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The MERLIN corpus: Learner language and the CEFR
Popis výsledku v původním jazyce
The MERLIN corpus is a written learner corpus for Czech, German, and Italian that has been designed to illustrate the Common European Framework of Reference for Languages (CEFR) with authentic learner data. The corpus contains 2,290 learner texts produced in standardized language certi?cations covering CEFR levels A1-C1. The MERLIN annotation scheme includes a wide range of language characteristics that enable research into the empirical foundations of the CEFR scales and provide language teachers, testdevelopers, and Second Language Acquisition researchers with concrete examples of learner performance and progress across multiple pro?ciency levels. For computational linguistics, it provide a range of authentic learner data for three target languages,supporting a broadening of the scope of research in areas such as automatic pro?ciency classi?cation or native language identi?cation. The annotated corpus and related information will be freely available as a corpus resource and through
Název v anglickém jazyce
The MERLIN corpus: Learner language and the CEFR
Popis výsledku anglicky
The MERLIN corpus is a written learner corpus for Czech, German, and Italian that has been designed to illustrate the Common European Framework of Reference for Languages (CEFR) with authentic learner data. The corpus contains 2,290 learner texts produced in standardized language certi?cations covering CEFR levels A1-C1. The MERLIN annotation scheme includes a wide range of language characteristics that enable research into the empirical foundations of the CEFR scales and provide language teachers, testdevelopers, and Second Language Acquisition researchers with concrete examples of learner performance and progress across multiple pro?ciency levels. For computational linguistics, it provide a range of authentic learner data for three target languages,supporting a broadening of the scope of research in areas such as automatic pro?ciency classi?cation or native language identi?cation. The annotated corpus and related information will be freely available as a corpus resource and through
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
R - Projekt Ramcoveho programu EK
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014)
ISBN
978-2-9517408-8-4
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
1281-1288
Název nakladatele
European Language Resources Association
Místo vydání
Reykjavík, Iceland
Místo konání akce
Reykjavík, Iceland
Datum konání akce
26. 5. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—