Automatická fonetická segmentace řečového signálu na bázi HMM a její implementace v prostředí programu Praat
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A00146275" target="_blank" >RIV/68407700:21230/07:00146275 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Automatická fonetická segmentace řečového signálu na bázi HMM a její implementace v prostředí programu Praat
Popis výsledku v původním jazyce
Fonetická segmetnace je úloha s častými použitím a technologiích zpracování řeči. Typické řešení použité i v tomto případě je založeno na zarovnání HMM modelů jednotlivých fónů. To je použito v nástroji využijícím HTK Toolkit, který je dále vložen do prostředí programu Praat. Uvedený systém je volně dostupný a je použitelný automatickou segmentaci dat velkého rozsahu i pro interativní práci, zejména při následné manuální segmentaci. to bylo hlavní motivací pro spolupráci s odbroníky Fonetického ústavu na Karlově Universite, pod vedením prof. Palkové, v rámci které byla analyzována detailně přesnost segmetnačního algoritmu, která je v průměru asi 10 ms.
Název v anglickém jazyce
Automated Phonetic Segmentation of Speech Based on HMM and its Implementation in Praat Environment
Popis výsledku anglicky
Phonetic segmentation is a task which is required in many applications of current speech technology. Typical solution used for this purpose is based on forced alignment of trained Hidden Markov Models (HMM) of particular phones. This approach is used inthe described tool which is constructed on the basis of HTK Toolkit and which is then included into the environment of program Praat. The system is available for public use and it can be used for automated phonetic segmentation of large data sets but also as an interactive tool for a pre-processing before further manual segmentation for the purposes of basic phonetic research. This is also main reason why we started to solve this problem in co-operation with Institute of Phonetics at Charles Universityin Prague. In the co-operation with the experts of phonetics from the group of prof. Palkova we also analyzed in details the precision of segmentation algorithm, which was approximately 10 ms.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F05%2F0278" target="_blank" >GA102/05/0278: Nové směry ve výzkumu a využití hlasových technologií</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Acta Universitatis Carolinae: Philologica
ISSN
0323-0767
e-ISSN
—
Svazek periodika
48
Číslo periodika v rámci svazku
2
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
13
Strana od-do
—
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—