Automatic Syllabification and Syllable Timing of Automatically Recognized Speech - for Czech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F16%3A00000467" target="_blank" >RIV/46747885:24220/16:00000467 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-45510-5_62" target="_blank" >http://dx.doi.org/10.1007/978-3-319-45510-5_62</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-45510-5_62" target="_blank" >10.1007/978-3-319-45510-5_62</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Automatic Syllabification and Syllable Timing of Automatically Recognized Speech - for Czech
Popis výsledku v původním jazyce
Our recent work was focused on automatic speech recognition (ASR) of spoken word archive documents [6,7]. One of the important tasks was to structuralize the recognized document (to segment the document and to detect sentence boundaries). Prosodic features play significant role in the spoken document structuralization. In our previous work we bound the prosodic information on the ASR events – words and noises. Many prosodic features (e.g. speech rate, vowel prominence or prolongation of last syllables) require higher time resolution than word-level [1]. For that reason we propose a scheme that is able to automatically syllabify the recognized words and by forced-alignment of its phonetic content provide the syllables (and its phonemes) with time-stamps.
Název v anglickém jazyce
Automatic Syllabification and Syllable Timing of Automatically Recognized Speech - for Czech
Popis výsledku anglicky
Our recent work was focused on automatic speech recognition (ASR) of spoken word archive documents [6,7]. One of the important tasks was to structuralize the recognized document (to segment the document and to detect sentence boundaries). Prosodic features play significant role in the spoken document structuralization. In our previous work we bound the prosodic information on the ASR events – words and noises. Many prosodic features (e.g. speech rate, vowel prominence or prolongation of last syllables) require higher time resolution than word-level [1]. For that reason we propose a scheme that is able to automatically syllabify the recognized words and by forced-alignment of its phonetic content provide the syllables (and its phonemes) with time-stamps.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proc. of the 19th International Conference of Text, Speech, and Dialogue - TSD 2016
ISBN
978-3-319-45509-9
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
8
Strana od-do
540-547
Název nakladatele
Springer International Publishing
Místo vydání
Switzerland
Místo konání akce
Brno, Česká Republika
Datum konání akce
1. 1. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000389707400062