Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F20%3A10419860" target="_blank" >RIV/00216208:11210/20:10419860 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/00216208:11320/20:10419860

  • Výsledek na webu

    <a href="https://lindat.mff.cuni.cz/services/teitok/skript2015/" target="_blank" >https://lindat.mff.cuni.cz/services/teitok/skript2015/</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol

  • Popis výsledku v původním jazyce

    Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii. U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány. Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.

  • Název v anglickém jazyce

    Skript 2015: Acquisition corpus of native speakers' Czech - transcripts of essays by students of primary and secondary schools

  • Popis výsledku anglicky

    The corpus contains short theses written by pupils, native speakers of Czech, at various language levels, including speakers of the Romani ethnolect, a total of 2582 texts and 380 thousand tokens. The pupils, aged 10-15, are from primary and secondary schools. The texts can be searched and viewed using the corpus tool TEITOK or KonText and are equipped with metadata and facsimiles. The texts were manually transcribed, including manual anonymization and a markup recording the author&apos;s corrections . The texts were manually and automatically annotated and manually revised. The results include: a) manual normalization on several levels: spelling and morphemics, morphosyntax, dictionary, b) automatic morphological analysis of the original text and all corrections, c) automatic identification of the type of spelling and morpheic errors.

Klasifikace

  • Druh

    O - Ostatní výsledky

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/EF16_019%2F0000734" target="_blank" >EF16_019/0000734: Kreativita a adaptabilita jako předpoklad úspěchu Evropy v propojeném světě</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2020

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů