Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10366966" target="_blank" >RIV/00216208:11210/17:10366966 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://wiki.korpus.cz/doku.php/en:cnk:ortofon" target="_blank" >http://wiki.korpus.cz/doku.php/en:cnk:ortofon</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem

  • Popis výsledku v původním jazyce

    Korpus ORTOFON navazuje svou koncepcí sběru dat na korpusy neformální mluvené češtiny řady ORAL. Společně s korpusem DIALEKT se jedná o první dva mluvené korpusy češtiny, které disponují víceúrovňovým přepisem. Stejně jako korpusy řady ORAL shromažďuje i ORTOFON spontánní mluvený jazyk užívaný v neformálních situacích mezi mluvčími, kteří se znají. Podobně jako v korpusu ORAL2013 pocházejí mluvčí z celé České republiky a jsou o nich shromažďovány vybrané sociologické informace. Korpus ORTOFON je také první korpus, který je plně vyvážený v rámci všech základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus je lemmatizován a morfologicky značkován stejně jako korpus ORAL, transkript je propojen se zvukovou stopou. Korpus ORTOFON umožňuje zkoumat různé aspekty mluveného jazyka, tj. lexikum, morfologii, syntax, pragmatiku, výstavbu dialogu. Korpus není primárně určen pro dialektologický 1) či fonetický výzkum, přesto zjednodušený fonetický přepis umožňuje ověřit existenci výslovnostních či regionálních variant nebo jevů souvisejících s výslovností. Zveřejněním korpusu ORTOFON spolu se spojeným korpusem ORAL se uživatelům otvírá možnost zkoumání neformální mluvené češtiny v dosud nejrozsáhlejším komplexu dat z patnáctiletého období (2002-2017).

  • Název v anglickém jazyce

    ORTOFON: Corpus of informal spoken Czech with multi-tier transcription

  • Popis výsledku anglicky

    he ORTOFON corpus, with its method of data collection, is a continuation of the corpora of informal spoken Czech from the ORAL series. Together with the DIALEKT corpus, it is one of the first two spoken corpora of the Czech language which have a multi-tier transcription. Same as with the corpora of the ORAL series, ORTOFON also collects spontaneous spoken language used in informal situations between speakers who know each other. Similarly, as in the corpus ORAL2013, the speakers come from all over the Czech Republic and selected sociological data are collected about them. ORTOFON is also the first corpus to be fully balanced regarding all the basic sociolinguistic speaker categories (gender, age group, level of education and region of childhood residence). The corpus is lemmatized morphologically tagged in the same manner as the ORAL corpus, the transcription is linked to the corresponding audio track. The ORTOFON corpus allows us to explore various aspects of spoken language, i.e. lexis, morphology, syntax, pragmatics, dialogue construction. The corpus is not primarily intended for dialectological 1) or phonetic research, even though a simplified phonetic transcription allows us to verify the existence of pronunciation or regional variants, or phenomena related to pronunciation. The publication of ORTOFON in connection with the ORAL corpus presents users the chance to explore informal spoken Czech in the most extensive data complex to date, covering a period of fifteen years (2002-2017).

Klasifikace

  • Druh

    S<sub>db</sub> - Specializovaná veřejná databáze

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2015044" target="_blank" >LM2015044: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Číslo předpisu

    LM2015044/ORTOFON

  • Označení certifikačního orgánu

    Ministerstvo školství, mládeže a tělovýchovy České republiky, Karmelitská 529/5, 118 00 Praha 1

  • Datum certifikace