Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378092%3A_____%2F09%3A00336652" target="_blank" >RIV/68378092:_____/09:00336652 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    DIALOG 0.3

  • Popis výsledku v původním jazyce

    Korpus DIALOG 0.3 obsahuje 70 nahrávek a přepisů televizních diskusních pořadů. Celková velikost korpusu je 493 089 textových slov. Počet mluvčích je 487, z toho 100 mluvčích vysloví více než 1000 slov. Přepisy jsou prozodicky a morfologicky anotovány alematizovány a spojeny s audiovizuální nahrávkou. Morfologická anotace a lematizace byla provedena automaticky. Korpus je přístupný na internetu, a to pouze pro registrované uživatele.

  • Název v anglickém jazyce

    The DIALOG 0.3 Corpus

  • Popis výsledku anglicky

    The DIALOG 0.3 corpus contains 70 audio-visual recordings and transcripts of discussion programs broadcast on Czech television stations. The corpus contains a total of 493 089 words. There are a total of 487 speakers, 100 of which uttered more than 1000words. The transcripts are prosodically and morphologically annotated and lemmatized (i.e. classified according to their basic word forms), and aligned with the audio-visual recordings. The morphological annotation and lemmatization were processed automatically. The corpus is available via Internet for registered users only

Klasifikace

  • Druh

    A - Audiovizuální tvorba

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/KJB900610701" target="_blank" >KJB900610701: Mluvená čeština ve veřejných dialozích: dobudování, zpřístupnění a průzkum korpusu DIALOG</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2009

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • ISBN

  • Místo vydání

    Praha

  • Název nakladatele resp. objednatele

    Ústav pro jazyk český AV ČR

  • Verze

    0.3

  • Identifikační číslo nosiče