Korpus spontánní mluvené češtiny ORAL2013

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10317192" target="_blank" >RIV/00216208:11210/15:10317192 - isvavai.cz</a>
Výsledek na webu
<a href="http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf" target="_blank" >http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Korpus spontánní mluvené češtiny ORAL2013
Popis výsledku v původním jazyce
Příspěvek představuje korpus spontánní mluvené češtiny ORAL2013, jeho složení i praktické aspekty jeho tvorby. Korpus je navržen jako reprezentace současného spontánního mluveného jazyka užívaného v neformálních každodenních situacích na území celé Českérepubliky. Korpus se skládá z nahrávek a jejich přepisů zarovnaných se zvukem pomocí časových značek, vyznačuje se pečlivou anotací a širokým regionálním pokrytím velkého množství mluvčích. ORAL2013 obsahuje 835 nahrávek z let 2008-2011 s celkem 2 544 mluvčími (z toho 1 297 jsou různí mluvčí), celková délka nahrávek činí téměř 300 hodin a objem přepsaného materiálu přesahuje 3,28 mil. slovních tvarů (tokens). ORAL2013 je veřejně přístupný v rámci projektu Český národní korpus na adrese http://www.korpus.cz/.
Název v anglickém jazyce
Corpus of spontaneous spoken Czech ORAL2013
Popis výsledku anglicky
The paper presents a corpus of spontaneous spoken Czech ORAL2013, its design principles and practical solutions adopted during the data collection. The corpus is designed as a representation of contemporary spontaneous spoken language used in informal, real-life situations in the whole Czech Republic. The corpus consists of audio recordings and their transcriptions aligned with time stamps, it features manual annotation and broad regional coverage with a large variety of speakers. ORAL2013 contains 835recordings from 2008-2011 with 2,544 speakers (out of which 1,297 speakers are unique), the total length of audio is almost 300 hours and the total size of the transcriptions exceeds 3.28 million tokens. ORAL2013 is publicly available within the framework of the Czech National Corpus at http://www.korpus.cz/.

Klasifikace

Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—

Návaznosti výsledku

Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název periodika
Časopis pro moderní filologii
ISSN
0008-7386
e-ISSN
—
Svazek periodika
97
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
9
Strana od-do
42-50
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—

Podobné výsledky(10)

Balanced data repository of spontaneous spoken Czech ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem Comparison of spoken corpora from a sociolinguistic perspective

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Korpus spontánní mluvené češtiny ORAL2013

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)