Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F20%3A10419860" target="_blank" >RIV/00216208:11210/20:10419860 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216208:11320/20:10419860
Výsledek na webu
<a href="https://lindat.mff.cuni.cz/services/teitok/skript2015/" target="_blank" >https://lindat.mff.cuni.cz/services/teitok/skript2015/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol
Popis výsledku v původním jazyce
Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii. U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány. Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.
Název v anglickém jazyce
Skript 2015: Acquisition corpus of native speakers' Czech - transcripts of essays by students of primary and secondary schools
Popis výsledku anglicky
The corpus contains short theses written by pupils, native speakers of Czech, at various language levels, including speakers of the Romani ethnolect, a total of 2582 texts and 380 thousand tokens. The pupils, aged 10-15, are from primary and secondary schools. The texts can be searched and viewed using the corpus tool TEITOK or KonText and are equipped with metadata and facsimiles. The texts were manually transcribed, including manual anonymization and a markup recording the author's corrections . The texts were manually and automatically annotated and manually revised. The results include: a) manual normalization on several levels: spelling and morphemics, morphosyntax, dictionary, b) automatic morphological analysis of the original text and all corrections, c) automatic identification of the type of spelling and morpheic errors.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/EF16_019%2F0000734" target="_blank" >EF16_019/0000734: Kreativita a adaptabilita jako předpoklad úspěchu Evropy v propojeném světě</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů