Modelling of Speaker Non-speech Events in Robust Speech Recognition
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F06%3A03129459" target="_blank" >RIV/68407700:21230/06:03129459 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Modelling of Speaker Non-speech Events in Robust Speech Recognition
Original language description
Experiments on modelling of speaker non-speech events (SNE) using robust speech recogniser based on hidden Markov models (HMM) are presented in this work. A speaker independent spoken Czech digits recogniser based on Czech phoneme modelling in real environment was used for this purpose. Only SNEs which are positioned in between words are modelled, as they can be easily added to the recogniser grammar as they were another word. The recognition results were analysed for two different testing datasets, each derived from the training sets (different in environmental conditions). At the end of the experiment the recognition score increased for about 22% and 11% for the used testing datasets against the results reached without modelling the events. The recogniser was also tested on data with unknown recording conditions. Low number of incorrectly inserted word shows that this modelling seem to be less dependent on recording conditions than pure phoneme model case.
Czech name
Modelování neřečových událostí řečníka při robustním rozpoznávání řeči
Czech description
Tento článek prezentuje experimenty v oblasti modelování neřečových událostí řečníka (NUR) v robustním rozpoznávači řeči s použitím rozpoznávače českých číslovek na bázi skrytých Markovových modelů monofónů pracujícího v reálném prostředí. Modelování NURa snadné zahrnutí těchto modelů do gramatiky rozpoznávače umožňuje poloha těchto neřečových událostí mezi jednotlivými slovy promluvy. Výsledky experimentů jsou srovnány na dvou sadách testovacích dat. Výsledné hodnoty zlepšení rozpoznávacího skóre o 22% a 11% a výrazné snížení chyby typu inzerce ukazují na vhodnost metody pro zvýšení robustnosti v úloze rozpoznávání řeči. Modely neřečových událostí také v experimentech vykazují nízkou citlivost na rozdílné nahrávací podmínky.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/GD102%2F03%2FH085" target="_blank" >GD102/03/H085: Biological and speech signal modelling</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 16th Czech-German Workshop on Speech Processing
ISBN
80-86269-15-9
ISSN
—
e-ISSN
—
Number of pages
7
Pages from-to
149-155
Publisher name
AV ČR, Ústav radiotechniky a elektroniky
Place of publication
Praha
Event location
Praha
Event date
Sep 27, 2006
Type of event by nationality
EUR - Evropská akce
UT code for WoS article
—