Working together towards an ideal infrastructure for language learner corpora

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F19%3A10402535" target="_blank" >RIV/00216208:11210/19:10402535 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Working together towards an ideal infrastructure for language learner corpora
Popis výsledku v původním jazyce
In this article, we provide an overview of first-hand experiences and vantage points for best practices from projects in seven European countries dedicated to learner corpus research (LCR) and the creation of language learner corpora. The corpora and tools involved in LCR are becoming more and more important, as are careful preparation and easy retrieval and reusability of corpora and tools. However, the lack of commonly agreed on solutions for many aspects of LCR, interoperability between learner corpora and the exchange of data from different learner corpus projects remains a challenge. We show how concepts like metadata, anonymization, error taxonomies and linguistic annotations as well as tools, toolchains and data formats can be individually challenging and how the challenges can be solved.
Název v anglickém jazyce
Working together towards an ideal infrastructure for language learner corpora
Popis výsledku anglicky
In this article, we provide an overview of first-hand experiences and vantage points for best practices from projects in seven European countries dedicated to learner corpus research (LCR) and the creation of language learner corpora. The corpora and tools involved in LCR are becoming more and more important, as are careful preparation and easy retrieval and reusability of corpora and tools. However, the lack of commonly agreed on solutions for many aspects of LCR, interoperability between learner corpora and the exchange of data from different learner corpus projects remains a challenge. We show how concepts like metadata, anonymization, error taxonomies and linguistic annotations as well as tools, toolchains and data formats can be individually challenging and how the challenges can be solved.

Klasifikace

Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
<a href="/cs/project/GA16-10185S" target="_blank" >GA16-10185S: Čeština nerodilých mluvčích z pohledu teoretického a komputačního</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název statě ve sborníku
Widening the Scope of Learner Corpus Research. Selected papers from the fourth Learner Corpus Research Conference
ISBN
—
ISSN
2034-6417
e-ISSN
—
Počet stran výsledku
42
Strana od-do
427-468
Název nakladatele
Presses universitaires de Louvain
Místo vydání
Louvain-la-Neuve
Místo konání akce
Bolzano, Itálie
Datum konání akce
5. 10. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—

Podobné výsledky(10)

Working together towards an ideal infrastructure for language learner corpora Corpora and Language Learning with the Sketch Engine and SKELL Exploring reusability and reproducibility for a research infrastructure for l1 and l2 learner corpora

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Working together towards an ideal infrastructure for language learner corpora

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)