Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

The DIALEKT corpus and its possibilities

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F19%3A10402341" target="_blank" >RIV/00216208:11210/19:10402341 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=YKIn6vGBQ4" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=YKIn6vGBQ4</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    The DIALEKT corpus and its possibilities

  • Popis výsledku v původním jazyce

    DIALEKT, a corpus of Czech dialects, is being continuously curated and expanded by the Spoken Corpora section of the Institute of the Czech National Corpus. The following paper aims first to give a concise characteristic of the corpus, addressing its sociolinguistic parameters and possible subcorpora derivable thereof, its two-layer approach to the transcription of dialect recordings, and lemmatization &amp; morphological tagging of the corpus. Subsequently, we move on to examples of how linguists can use the corpus, and discuss two related projects which expand upon currently available possibilities: an archive of dialect-specific differential phones of the Czech language (completed), and an interactive web environment for spatial map-based visualization of data from all kinds of spoken corpora (in preparation). Thanks in part also to these additional tools, the DIALEKT corpus should serve both experts in the field as well as the general public.

  • Název v anglickém jazyce

    The DIALEKT corpus and its possibilities

  • Popis výsledku anglicky

    DIALEKT, a corpus of Czech dialects, is being continuously curated and expanded by the Spoken Corpora section of the Institute of the Czech National Corpus. The following paper aims first to give a concise characteristic of the corpus, addressing its sociolinguistic parameters and possible subcorpora derivable thereof, its two-layer approach to the transcription of dialect recordings, and lemmatization &amp; morphological tagging of the corpus. Subsequently, we move on to examples of how linguists can use the corpus, and discuss two related projects which expand upon currently available possibilities: an archive of dialect-specific differential phones of the Czech language (completed), and an interactive web environment for spatial map-based visualization of data from all kinds of spoken corpora (in preparation). Thanks in part also to these additional tools, the DIALEKT corpus should serve both experts in the field as well as the general public.

Klasifikace

  • Druh

    J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2015044" target="_blank" >LM2015044: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2019

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Jazykovedny Casopis

  • ISSN

    0021-5597

  • e-ISSN

  • Svazek periodika

    70

  • Číslo periodika v rámci svazku

    2

  • Stát vydavatele periodika

    SK - Slovenská republika

  • Počet stran výsledku

    9

  • Strana od-do

    336-344

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus

    2-s2.0-85078638968