Korpus spontánní mluvené češtiny ORAL2013
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10317192" target="_blank" >RIV/00216208:11210/15:10317192 - isvavai.cz</a>
Výsledek na webu
<a href="http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf" target="_blank" >http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpus spontánní mluvené češtiny ORAL2013
Popis výsledku v původním jazyce
Příspěvek představuje korpus spontánní mluvené češtiny ORAL2013, jeho složení i praktické aspekty jeho tvorby. Korpus je navržen jako reprezentace současného spontánního mluveného jazyka užívaného v neformálních každodenních situacích na území celé Českérepubliky. Korpus se skládá z nahrávek a jejich přepisů zarovnaných se zvukem pomocí časových značek, vyznačuje se pečlivou anotací a širokým regionálním pokrytím velkého množství mluvčích. ORAL2013 obsahuje 835 nahrávek z let 2008-2011 s celkem 2 544 mluvčími (z toho 1 297 jsou různí mluvčí), celková délka nahrávek činí téměř 300 hodin a objem přepsaného materiálu přesahuje 3,28 mil. slovních tvarů (tokens). ORAL2013 je veřejně přístupný v rámci projektu Český národní korpus na adrese http://www.korpus.cz/.
Název v anglickém jazyce
Corpus of spontaneous spoken Czech ORAL2013
Popis výsledku anglicky
The paper presents a corpus of spontaneous spoken Czech ORAL2013, its design principles and practical solutions adopted during the data collection. The corpus is designed as a representation of contemporary spontaneous spoken language used in informal, real-life situations in the whole Czech Republic. The corpus consists of audio recordings and their transcriptions aligned with time stamps, it features manual annotation and broad regional coverage with a large variety of speakers. ORAL2013 contains 835recordings from 2008-2011 with 2,544 speakers (out of which 1,297 speakers are unique), the total length of audio is almost 300 hours and the total size of the transcriptions exceeds 3.28 million tokens. ORAL2013 is publicly available within the framework of the Czech National Corpus at http://www.korpus.cz/.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Časopis pro moderní filologii
ISSN
0008-7386
e-ISSN
—
Svazek periodika
97
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
9
Strana od-do
42-50
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—