All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

On Building of Czech Spontaneous Speech Corpus

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000225" target="_blank" >RIV/49777513:23520/07:00000225 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    On Building of Czech Spontaneous Speech Corpus

  • Original language description

    This article describes the whole process of gathering the LAC corpora used to train the LASER automatic speech recognition system. Special focus is put onto our recent effort to build corpora of spontaneous speech, i.e. non-read speech, referenced to asLAC SS. The building of the copora is followed from initial considerations, through a design and development of necessary tools, a selection of material, environment and speakers, a recording, a transcription, to concluding quality evaluation of the collected corpora.

  • Czech name

    Tvorba českého korpusu spontánní řeči

  • Czech description

    Článek popisuje celý proces sběru LAC, který se používá pro trénování rozpoznáváče LASER. Zvláštní pozornost je věnována tvorbě korpusu přirozené řeči LAC SS. Tvorba korpusu je popsaná od úvodních úvah, rozboru požadavků na materiál, vývoje potřebných nástrojů, výběru mluvčích a prostředí, přes záznam, transkripci, až po vyhodnocení kvality výsledku.

Classification

  • Type

    D - Article in proceedings

  • CEP classification

    AI - Linguistics

  • OECD FORD branch

Result continuities

  • Project

    <a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2007

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Article name in the collection

    Specom 2007 proceedings

  • ISBN

    5-7452-0110-X

  • ISSN

  • e-ISSN

  • Number of pages

    6

  • Pages from-to

    913-918

  • Publisher name

    Moscow State Linguistic University

  • Place of publication

    Moscow

  • Event location

    Moskva

  • Event date

    Jan 1, 2007

  • Type of event by nationality

    WRD - Celosvětová akce

  • UT code for WoS article