DIALOG 1.0: Multimediální korpus mluvené češtiny
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378092%3A_____%2F09%3A00336657" target="_blank" >RIV/68378092:_____/09:00336657 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
DIALOG 1.0: Multimediální korpus mluvené češtiny
Popis výsledku v původním jazyce
Korpus DIALOG 1.0 obsahuje 100 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 666 695 textových slov. Počet mluvčích je 618, z toho 159 mluvčích vysloví více než 1000 slov. Přepisy jsou prozodicky a morfologicky anotovány alematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný na internetu, a to pouze pro registrované uživatele.
Název v anglickém jazyce
DIALOG 1.0: A multimodal corpus of spoken Czech
Popis výsledku anglicky
The DIALOG 1.0 corpus contains 100 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. The corpus contains a total of 666 695 words. There are a total of 618 speakers, 159 of which uttered more than 1000words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only.
Klasifikace
Druh
A - Audiovizuální tvorba
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/KJB900610701" target="_blank" >KJB900610701: Mluvená čeština ve veřejných dialozích: dobudování, zpřístupnění a průzkum korpusu DIALOG</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2009
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
ISBN
—
Místo vydání
Praha
Název nakladatele resp. objednatele
Ústav pro jazyk český AV ČR
Verze
1.0
Identifikační číslo nosiče
—