První korpus mluvčích češtiny v dětském věku
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F25%3A2RNAJE5K" target="_blank" >RIV/00216208:11320/25:2RNAJE5K - isvavai.cz</a>
Výsledek na webu
<a href="https://dspace.cuni.cz/bitstream/handle/20.500.11956/190532/Anna_Chroma_-_Klara_Matiasovitsova_107-109.pdf?sequence=1" target="_blank" >https://dspace.cuni.cz/bitstream/handle/20.500.11956/190532/Anna_Chroma_-_Klara_Matiasovitsova_107-109.pdf?sequence=1</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
První korpus mluvčích češtiny v dětském věku
Popis výsledku v původním jazyce
The article discusses the Chroma corpus, a newly published dataset capturing the spoken interactions of monolingual Czech children aged 19 to 49 months. This corpus fills a chronological gap in Czech language acquisition research and is part of the international CHILDES database. The Chroma corpus includes audio recordings of spontaneous interactions between children and their caregivers, recorded longitudinally over 11 to 27 months. These recordings are transcribed using the CHAT transcription system, which is standard for CHILDES. The corpus contains 99,388 tokens in children's utterances and 238,211 tokens in adult utterances. The transcriptions are annotated morphologically using the MorphoDiTa tool, allowing for detailed linguistic analysis. The Chroma corpus is a significant resource for studying various linguistic phenomena, including morphological and syntactic innovations, and contributes to the broader understanding of first language acquisition.
Název v anglickém jazyce
První korpus mluvčích češtiny v dětském věku
Popis výsledku anglicky
The article discusses the Chroma corpus, a newly published dataset capturing the spoken interactions of monolingual Czech children aged 19 to 49 months. This corpus fills a chronological gap in Czech language acquisition research and is part of the international CHILDES database. The Chroma corpus includes audio recordings of spontaneous interactions between children and their caregivers, recorded longitudinally over 11 to 27 months. These recordings are transcribed using the CHAT transcription system, which is standard for CHILDES. The corpus contains 99,388 tokens in children's utterances and 238,211 tokens in adult utterances. The transcriptions are annotated morphologically using the MorphoDiTa tool, allowing for detailed linguistic analysis. The Chroma corpus is a significant resource for studying various linguistic phenomena, including morphological and syntactic innovations, and contributes to the broader understanding of first language acquisition.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
ČASOPIS PRO MODERNÍ FILOLOGII
ISSN
2336-6591
e-ISSN
—
Svazek periodika
2024
Číslo periodika v rámci svazku
106
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
3
Strana od-do
107-109
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—