Collection and annotation of spontaneous speech database

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F08%3A03149222" target="_blank" >RIV/68407700:21230/08:03149222 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Sběr a anotace databáze spontánních promluv
Original language description
Nasazení rozpoznávače řeči v reálném systému přináší nutnost rozpoznávat promluvy spontánního charakteru snímané v reálném prostředí. Databáze čtené řeči, které jsou často využívané pro trénování rozpoznávačů řeči, nejsou pro trénování takových robustních systémů vhodné, neboť nevystihují správně charakter spontánních promluv, především s ohledem na výskyt neřečových událostí, použitý slovník, změny ve výslovnosti a slovosledu apod. Prezentovaná databáze spontánních promluv tak pomáhá doplnit tyto jevyve stávající sadě řečových dat. Příspěvek popisuje postup nahrávání a anotace přednášek s technickou tématikou a uvádí porovnání těchto promluv s čtenou řečí. Dále je uveden postup automatického zarovnání, který vede ke snížení počtu označených méně významných neřečových událostí. Experiment s rozpoznáváním váhavých pauz ukazuje přínos spontánních řečových dat pro kvalitu modelování těchto událostí.
Czech name
Sběr a anotace databáze spontánních promluv
Czech description
Nasazení rozpoznávače řeči v reálném systému přináší nutnost rozpoznávat promluvy spontánního charakteru snímané v reálném prostředí. Databáze čtené řeči, které jsou často využívané pro trénování rozpoznávačů řeči, nejsou pro trénování takových robustních systémů vhodné, neboť nevystihují správně charakter spontánních promluv, především s ohledem na výskyt neřečových událostí, použitý slovník, změny ve výslovnosti a slovosledu apod. Prezentovaná databáze spontánních promluv tak pomáhá doplnit tyto jevyve stávající sadě řečových dat. Příspěvek popisuje postup nahrávání a anotace přednášek s technickou tématikou a uvádí porovnání těchto promluv s čtenou řečí. Dále je uveden postup automatického zarovnání, který vede ke snížení počtu označených méně významných neřečových událostí. Experiment s rozpoznáváním váhavých pauz ukazuje přínos spontánních řečových dat pro kvalitu modelování těchto událostí.

Classification

Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—

Result continuities

Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)

Others

Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

Article name in the collection
Analýza a zpracování řečových a biologických signálů - sborník prací 2008
ISBN
978-80-01-04243-4
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
České vysoké učení technické v Praze
Place of publication
Praha
Event location
Praha
Event date
Oct 1, 2008
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—

Similar results(10)

Czech Spontaneous Speech Collection and Annotation: The Database of Technical Lectures Semi-Automatic Non-speech Events Database Formation Speaker Non-Speech Event Modelling in Recognition of Read and Spontaneous Speech

What are you looking for?

Quick search

Smart search

Collection and annotation of spontaneous speech database

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)