Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F20%3A10419860" target="_blank" >RIV/00216208:11210/20:10419860 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216208:11320/20:10419860
Výsledek na webu
<a href="https://lindat.mff.cuni.cz/services/teitok/skript2015/" target="_blank" >https://lindat.mff.cuni.cz/services/teitok/skript2015/</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol
Popis výsledku v původním jazyce
Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii. U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány. Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.
Název v anglickém jazyce
Skript 2015: Acquisition corpus of native speakers' Czech - transcripts of essays by students of primary and secondary schools
Popis výsledku anglicky
The corpus contains short theses written by pupils, native speakers of Czech, at various language levels, including speakers of the Romani ethnolect, a total of 2582 texts and 380 thousand tokens. The pupils, aged 10-15, are from primary and secondary schools. The texts can be searched and viewed using the corpus tool TEITOK or KonText and are equipped with metadata and facsimiles. The texts were manually transcribed, including manual anonymization and a markup recording the author's corrections . The texts were manually and automatically annotated and manually revised. The results include: a) manual normalization on several levels: spelling and morphemics, morphosyntax, dictionary, b) automatic morphological analysis of the original text and all corrections, c) automatic identification of the type of spelling and morpheic errors.

Klasifikace

Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
<a href="/cs/project/EF16_019%2F0000734" target="_blank" >EF16_019/0000734: Kreativita a adaptabilita jako předpoklad úspěchu Evropy v propojeném světě</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Podobné výsledky(10)

CzeSL-man v1 searchable - korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu CzeSL - an error tagged corpus of Czech as a second language Building a learner corpus

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Podobné výsledky(10)