Collection and annotation of spontaneous speech database
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F08%3A03149222" target="_blank" >RIV/68407700:21230/08:03149222 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Sběr a anotace databáze spontánních promluv
Original language description
Nasazení rozpoznávače řeči v reálném systému přináší nutnost rozpoznávat promluvy spontánního charakteru snímané v reálném prostředí. Databáze čtené řeči, které jsou často využívané pro trénování rozpoznávačů řeči, nejsou pro trénování takových robustních systémů vhodné, neboť nevystihují správně charakter spontánních promluv, především s ohledem na výskyt neřečových událostí, použitý slovník, změny ve výslovnosti a slovosledu apod. Prezentovaná databáze spontánních promluv tak pomáhá doplnit tyto jevyve stávající sadě řečových dat. Příspěvek popisuje postup nahrávání a anotace přednášek s technickou tématikou a uvádí porovnání těchto promluv s čtenou řečí. Dále je uveden postup automatického zarovnání, který vede ke snížení počtu označených méně významných neřečových událostí. Experiment s rozpoznáváním váhavých pauz ukazuje přínos spontánních řečových dat pro kvalitu modelování těchto událostí.
Czech name
Sběr a anotace databáze spontánních promluv
Czech description
Nasazení rozpoznávače řeči v reálném systému přináší nutnost rozpoznávat promluvy spontánního charakteru snímané v reálném prostředí. Databáze čtené řeči, které jsou často využívané pro trénování rozpoznávačů řeči, nejsou pro trénování takových robustních systémů vhodné, neboť nevystihují správně charakter spontánních promluv, především s ohledem na výskyt neřečových událostí, použitý slovník, změny ve výslovnosti a slovosledu apod. Prezentovaná databáze spontánních promluv tak pomáhá doplnit tyto jevyve stávající sadě řečových dat. Příspěvek popisuje postup nahrávání a anotace přednášek s technickou tématikou a uvádí porovnání těchto promluv s čtenou řečí. Dále je uveden postup automatického zarovnání, který vede ke snížení počtu označených méně významných neřečových událostí. Experiment s rozpoznáváním váhavých pauz ukazuje přínos spontánních řečových dat pro kvalitu modelování těchto událostí.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Analýza a zpracování řečových a biologických signálů - sborník prací 2008
ISBN
978-80-01-04243-4
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
České vysoké učení technické v Praze
Place of publication
Praha
Event location
Praha
Event date
Oct 1, 2008
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—