Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Kartografické a geografické zpracování dat z mluvených korpusů

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10297754" target="_blank" >RIV/00216208:11210/15:10297754 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Kartografické a geografické zpracování dat z mluvených korpusů

  • Popis výsledku v původním jazyce

    V tomto příspěvku představujeme nový způsob využití map při budování i využívání mluvených korpusů v Českém národním korpusu (ČNK). Zavedení kategorie nářečních oblastí do sběru mluvených dat si vyžádalo vytvoření přehledné mapy těchto oblastí, podle které se editoři orientovali při zařazování mluvčích. V korpusech řady ORAL (ORAL2006, ORAL2008, ORAL2013) k tomuto účelu sloužila statická mapa vycházející z Běličova pojetí (Bělič, 1972). Korpus ORAL2013 navíc zachycuje jazyková data mluvčích z území celéČeské republiky, proto potřebujeme mít k dispozici kvalitní podkladové mapy. S budováním nových korpusů mluveného jazyka ORTOFON a DIALEKT (jedná se o dva rozdílné korpusy, které se liší metodikou sběru dat i zpracová-ním jazykového materiálu, viz kapitoly 2.2, 2.3; oba obsahují nahrávky mluvčích ze všech nářečních oblastí České republiky) se využívání této mapy jevilo jako nedostatečné, proto jsme se rozhodli ve spolupráci s kartografem vytvořit mapu, která by sloužila k různým účelům:

  • Název v anglickém jazyce

    Cartographical and geographical treatment of spoken corpus data

  • Popis výsledku anglicky

    Visualizing spoken corpus data on a map is an invaluable tool both at the stage of data collection (keeping track of numbers of speakers from different regions for corpus balancing purposes) and data exploration (examining the regional distribution of asociolinguistic variable). Recently, a tool in this vein has been made available to Czech National Corpus users via the SyD application: a map summarizing the proportional usage of a given set of variants across the traditional dialect regions of Czech represented in the ORAL series corpora. The advantages of this new feature are discussed and examples highlighting how it can give an intuitive overview of dialectal variation are given. Current and future plans for other useful types of map-based visualizations of spoken corpus data are also presented.

Klasifikace

  • Druh

    J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2015

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Korpus - gramatika - axiologie

  • ISSN

    1804-137X

  • e-ISSN

  • Svazek periodika

    2015

  • Číslo periodika v rámci svazku

    11

  • Stát vydavatele periodika

    CZ - Česká republika

  • Počet stran výsledku

    13

  • Strana od-do

    42-54

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus