Kartografické a geografické zpracování dat z mluvených korpusů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10297754" target="_blank" >RIV/00216208:11210/15:10297754 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Kartografické a geografické zpracování dat z mluvených korpusů
Popis výsledku v původním jazyce
V tomto příspěvku představujeme nový způsob využití map při budování i využívání mluvených korpusů v Českém národním korpusu (ČNK). Zavedení kategorie nářečních oblastí do sběru mluvených dat si vyžádalo vytvoření přehledné mapy těchto oblastí, podle které se editoři orientovali při zařazování mluvčích. V korpusech řady ORAL (ORAL2006, ORAL2008, ORAL2013) k tomuto účelu sloužila statická mapa vycházející z Běličova pojetí (Bělič, 1972). Korpus ORAL2013 navíc zachycuje jazyková data mluvčích z území celéČeské republiky, proto potřebujeme mít k dispozici kvalitní podkladové mapy. S budováním nových korpusů mluveného jazyka ORTOFON a DIALEKT (jedná se o dva rozdílné korpusy, které se liší metodikou sběru dat i zpracová-ním jazykového materiálu, viz kapitoly 2.2, 2.3; oba obsahují nahrávky mluvčích ze všech nářečních oblastí České republiky) se využívání této mapy jevilo jako nedostatečné, proto jsme se rozhodli ve spolupráci s kartografem vytvořit mapu, která by sloužila k různým účelům:
Název v anglickém jazyce
Cartographical and geographical treatment of spoken corpus data
Popis výsledku anglicky
Visualizing spoken corpus data on a map is an invaluable tool both at the stage of data collection (keeping track of numbers of speakers from different regions for corpus balancing purposes) and data exploration (examining the regional distribution of asociolinguistic variable). Recently, a tool in this vein has been made available to Czech National Corpus users via the SyD application: a map summarizing the proportional usage of a given set of variants across the traditional dialect regions of Czech represented in the ORAL series corpora. The advantages of this new feature are discussed and examples highlighting how it can give an intuitive overview of dialectal variation are given. Current and future plans for other useful types of map-based visualizations of spoken corpus data are also presented.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Korpus - gramatika - axiologie
ISSN
1804-137X
e-ISSN
—
Svazek periodika
2015
Číslo periodika v rámci svazku
11
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
13
Strana od-do
42-54
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—