Minulost, současnost a budoucnost korpusu DIALOG
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378092%3A_____%2F08%3A00319394" target="_blank" >RIV/68378092:_____/08:00319394 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Minulost, současnost a budoucnost korpusu DIALOG
Popis výsledku v původním jazyce
Korpus DIALOG je speciální korpus mluvené češtiny, v němž jsou shromažďovány audiovizuální nahrávky a přepisy televizních diskusních pořadů. Pracovní verze korpusu obsahuje více než 2 mil. textových slov. Článek se zabývá historií korpusu, popisuje jehosoučasný stav a věnuje se také výhledům do budoucnosti. Součástí článku je komentovaný přehled studií (témat a hlavních výsledků), které byly vytvořeny s využitím dat z korpusu DIALOG za celou jeho existenci.
Název v anglickém jazyce
The past, present, and future of the DIALOG corpus
Popis výsledku anglicky
The DIALOG corpus is a special corpus of spoken Czech, consisting of video recordings and transcripts of television discussions. The working form of the corpus contains more than two million words. In the introductory section of this paper, we discuss the motivation that led the researchers from the Czech Language Institute, Academy of Sciences of the Czech Republic to collect and analyze dialogical speech, and we also present an overview of the publications based on work with the corpus. In the secondsection, we provide information about turning the collected material into an electronic linguistic corpus and about the basic characteristics of the working version of the DIALOG corpus and its first public version, known as DIALOG 0.1 (http://ujc.dialogy.cz). In the concluding section, we present the anticipated schedule for releasing the corpus for public access; we also indicate some currently relevant areas of research that can benefit from using the DIALOG corpus.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/KJB900610701" target="_blank" >KJB900610701: Mluvená čeština ve veřejných dialozích: dobudování, zpřístupnění a průzkum korpusu DIALOG</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Gramatika a korpus 2007
ISBN
978-80-200-1634-8
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
—
Název nakladatele
Academia
Místo vydání
Praha
Místo konání akce
Liblice
Datum konání akce
25. 9. 2007
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—