On Building of Czech Spontaneous Speech Corpus
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000225" target="_blank" >RIV/49777513:23520/07:00000225 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
On Building of Czech Spontaneous Speech Corpus
Original language description
This article describes the whole process of gathering the LAC corpora used to train the LASER automatic speech recognition system. Special focus is put onto our recent effort to build corpora of spontaneous speech, i.e. non-read speech, referenced to asLAC SS. The building of the copora is followed from initial considerations, through a design and development of necessary tools, a selection of material, environment and speakers, a recording, a transcription, to concluding quality evaluation of the collected corpora.
Czech name
Tvorba českého korpusu spontánní řeči
Czech description
Článek popisuje celý proces sběru LAC, který se používá pro trénování rozpoznáváče LASER. Zvláštní pozornost je věnována tvorbě korpusu přirozené řeči LAC SS. Tvorba korpusu je popsaná od úvodních úvah, rozboru požadavků na materiál, vývoje potřebných nástrojů, výběru mluvčích a prostředí, přes záznam, transkripci, až po vyhodnocení kvality výsledku.
Classification
Type
D - Article in proceedings
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Specom 2007 proceedings
ISBN
5-7452-0110-X
ISSN
—
e-ISSN
—
Number of pages
6
Pages from-to
913-918
Publisher name
Moscow State Linguistic University
Place of publication
Moscow
Event location
Moskva
Event date
Jan 1, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—