Kartografické a geografické zpracování dat z mluvených korpusů

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10297754" target="_blank" >RIV/00216208:11210/15:10297754 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Kartografické a geografické zpracování dat z mluvených korpusů
Popis výsledku v původním jazyce
V tomto příspěvku představujeme nový způsob využití map při budování i využívání mluvených korpusů v Českém národním korpusu (ČNK). Zavedení kategorie nářečních oblastí do sběru mluvených dat si vyžádalo vytvoření přehledné mapy těchto oblastí, podle které se editoři orientovali při zařazování mluvčích. V korpusech řady ORAL (ORAL2006, ORAL2008, ORAL2013) k tomuto účelu sloužila statická mapa vycházející z Běličova pojetí (Bělič, 1972). Korpus ORAL2013 navíc zachycuje jazyková data mluvčích z území celéČeské republiky, proto potřebujeme mít k dispozici kvalitní podkladové mapy. S budováním nových korpusů mluveného jazyka ORTOFON a DIALEKT (jedná se o dva rozdílné korpusy, které se liší metodikou sběru dat i zpracová-ním jazykového materiálu, viz kapitoly 2.2, 2.3; oba obsahují nahrávky mluvčích ze všech nářečních oblastí České republiky) se využívání této mapy jevilo jako nedostatečné, proto jsme se rozhodli ve spolupráci s kartografem vytvořit mapu, která by sloužila k různým účelům:
Název v anglickém jazyce
Cartographical and geographical treatment of spoken corpus data
Popis výsledku anglicky
Visualizing spoken corpus data on a map is an invaluable tool both at the stage of data collection (keeping track of numbers of speakers from different regions for corpus balancing purposes) and data exploration (examining the regional distribution of asociolinguistic variable). Recently, a tool in this vein has been made available to Czech National Corpus users via the SyD application: a map summarizing the proportional usage of a given set of variants across the traditional dialect regions of Czech represented in the ORAL series corpora. The advantages of this new feature are discussed and examples highlighting how it can give an intuitive overview of dialectal variation are given. Current and future plans for other useful types of map-based visualizations of spoken corpus data are also presented.

Klasifikace

Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—

Návaznosti výsledku

Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název periodika
Korpus - gramatika - axiologie
ISSN
1804-137X
e-ISSN
—
Svazek periodika
2015
Číslo periodika v rámci svazku
11
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
13
Strana od-do
42-54
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—

Podobné výsledky(10)

Mapka : Mapová aplikace pro korpusy mluvené češtiny The DIALEKT corpus and its possibilities New spoken corpora of Czech: ORTOFON and DIALEKT

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Kartografické a geografické zpracování dat z mluvených korpusů

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)