ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10366966" target="_blank" >RIV/00216208:11210/17:10366966 - isvavai.cz</a>
Výsledek na webu
<a href="http://wiki.korpus.cz/doku.php/en:cnk:ortofon" target="_blank" >http://wiki.korpus.cz/doku.php/en:cnk:ortofon</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem
Popis výsledku v původním jazyce
Korpus ORTOFON navazuje svou koncepcí sběru dat na korpusy neformální mluvené češtiny řady ORAL. Společně s korpusem DIALEKT se jedná o první dva mluvené korpusy češtiny, které disponují víceúrovňovým přepisem. Stejně jako korpusy řady ORAL shromažďuje i ORTOFON spontánní mluvený jazyk užívaný v neformálních situacích mezi mluvčími, kteří se znají. Podobně jako v korpusu ORAL2013 pocházejí mluvčí z celé České republiky a jsou o nich shromažďovány vybrané sociologické informace. Korpus ORTOFON je také první korpus, který je plně vyvážený v rámci všech základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus je lemmatizován a morfologicky značkován stejně jako korpus ORAL, transkript je propojen se zvukovou stopou. Korpus ORTOFON umožňuje zkoumat různé aspekty mluveného jazyka, tj. lexikum, morfologii, syntax, pragmatiku, výstavbu dialogu. Korpus není primárně určen pro dialektologický 1) či fonetický výzkum, přesto zjednodušený fonetický přepis umožňuje ověřit existenci výslovnostních či regionálních variant nebo jevů souvisejících s výslovností. Zveřejněním korpusu ORTOFON spolu se spojeným korpusem ORAL se uživatelům otvírá možnost zkoumání neformální mluvené češtiny v dosud nejrozsáhlejším komplexu dat z patnáctiletého období (2002-2017).
Název v anglickém jazyce
ORTOFON: Corpus of informal spoken Czech with multi-tier transcription
Popis výsledku anglicky
he ORTOFON corpus, with its method of data collection, is a continuation of the corpora of informal spoken Czech from the ORAL series. Together with the DIALEKT corpus, it is one of the first two spoken corpora of the Czech language which have a multi-tier transcription. Same as with the corpora of the ORAL series, ORTOFON also collects spontaneous spoken language used in informal situations between speakers who know each other. Similarly, as in the corpus ORAL2013, the speakers come from all over the Czech Republic and selected sociological data are collected about them. ORTOFON is also the first corpus to be fully balanced regarding all the basic sociolinguistic speaker categories (gender, age group, level of education and region of childhood residence). The corpus is lemmatized morphologically tagged in the same manner as the ORAL corpus, the transcription is linked to the corresponding audio track. The ORTOFON corpus allows us to explore various aspects of spoken language, i.e. lexis, morphology, syntax, pragmatics, dialogue construction. The corpus is not primarily intended for dialectological 1) or phonetic research, even though a simplified phonetic transcription allows us to verify the existence of pronunciation or regional variants, or phenomena related to pronunciation. The publication of ORTOFON in connection with the ORAL corpus presents users the chance to explore informal spoken Czech in the most extensive data complex to date, covering a period of fifteen years (2002-2017).

Klasifikace

Druh
S<sub>db</sub> - Specializovaná veřejná databáze
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
<a href="/cs/project/LM2015044" target="_blank" >LM2015044: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Číslo předpisu
LM2015044/ORTOFON
Označení certifikačního orgánu
Ministerstvo školství, mládeže a tělovýchovy České republiky, Karmelitská 529/5, 118 00 Praha 1
Datum certifikace
—

Podobné výsledky(10)

Mapping Diatopic and Diachronic Variation in Spoken Czech: the ORTOFON and DIALEKT Corpora Differences in Spoken Language Processing in General Corpora (ORAL, ORTOFON) and in a Specialized Corpus (DIALEKT) and Their Reflection in the Mapka Application ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

Co hledáte?

Rychlé hledání

Chytré vyhledávání

ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)