Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Korpus spontánní mluvené češtiny ORAL2013

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10317192" target="_blank" >RIV/00216208:11210/15:10317192 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf" target="_blank" >http://cmf.ff.cuni.cz/sites/default/files/Lucie%20Beneseva_%20Michal%20Kren_42-50.pdf</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpus spontánní mluvené češtiny ORAL2013

  • Popis výsledku v původním jazyce

    Příspěvek představuje korpus spontánní mluvené češtiny ORAL2013, jeho složení i praktické aspekty jeho tvorby. Korpus je navržen jako reprezentace současného spontánního mluveného jazyka užívaného v neformálních každodenních situacích na území celé Českérepubliky. Korpus se skládá z nahrávek a jejich přepisů zarovnaných se zvukem pomocí časových značek, vyznačuje se pečlivou anotací a širokým regionálním pokrytím velkého množství mluvčích. ORAL2013 obsahuje 835 nahrávek z let 2008-2011 s celkem 2 544 mluvčími (z toho 1 297 jsou různí mluvčí), celková délka nahrávek činí téměř 300 hodin a objem přepsaného materiálu přesahuje 3,28 mil. slovních tvarů (tokens). ORAL2013 je veřejně přístupný v rámci projektu Český národní korpus na adrese http://www.korpus.cz/.

  • Název v anglickém jazyce

    Corpus of spontaneous spoken Czech ORAL2013

  • Popis výsledku anglicky

    The paper presents a corpus of spontaneous spoken Czech ORAL2013, its design principles and practical solutions adopted during the data collection. The corpus is designed as a representation of contemporary spontaneous spoken language used in informal, real-life situations in the whole Czech Republic. The corpus consists of audio recordings and their transcriptions aligned with time stamps, it features manual annotation and broad regional coverage with a large variety of speakers. ORAL2013 contains 835recordings from 2008-2011 with 2,544 speakers (out of which 1,297 speakers are unique), the total length of audio is almost 300 hours and the total size of the transcriptions exceeds 3.28 million tokens. ORAL2013 is publicly available within the framework of the Czech National Corpus at http://www.korpus.cz/.

Klasifikace

  • Druh

    J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2015

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Časopis pro moderní filologii

  • ISSN

    0008-7386

  • e-ISSN

  • Svazek periodika

    97

  • Číslo periodika v rámci svazku

    1

  • Stát vydavatele periodika

    CZ - Česká republika

  • Počet stran výsledku

    9

  • Strana od-do

    42-50

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus