Skript 2015: Acquisition corpus of native speakers' Czech - transcripts of essays by students of primary and secondary schools

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F20%3A10419860" target="_blank" >RIV/00216208:11210/20:10419860 - isvavai.cz</a>
Alternative codes found
RIV/00216208:11320/20:10419860
Result on the web
<a href="https://lindat.mff.cuni.cz/services/teitok/skript2015/" target="_blank" >https://lindat.mff.cuni.cz/services/teitok/skript2015/</a>
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol
Original language description
Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii. U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány. Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.
Czech name
Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol
Czech description
Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii. U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány. Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.

Classification

Type
O - Miscellaneous
CEP classification
—
OECD FORD branch
60203 - Linguistics

Result continuities

Project
<a href="/en/project/EF16_019%2F0000734" target="_blank" >EF16_019/0000734: Creativity and Adaptability as Conditions of the Success of Europe in an Interrelated World</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

Publication year
2020
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Similar results(10)

CzeSL-man v1 searchable - a corpus of non-native Czech with manual error annotation in a simplified tiered scheme CzeSL - an error tagged corpus of Czech as a second language Building a learner corpus

What are you looking for?

Quick search

Smart search

Skript 2015: Acquisition corpus of native speakers' Czech - transcripts of essays by students of primary and secondary schools

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Similar results(10)