HMM-Based Phonetic Segmentation in Praat Environment
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03137073" target="_blank" >RIV/68407700:21230/07:03137073 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
HMM-Based Phonetic Segmentation in Praat Environment
Original language description
Phonetic segmentation is required in many applications of current speech technologies. One of the most frequently used methods is based on forced alignment of trained Hidden Markov models of phones. This approach is used in our phonetic segmentation toolwhich is constructed on the basis of HTK toolkit and integrated with the Praat environment. The system is currently used for Czech language and the required input is speech of known content, i.e. with its orthographic record. The system creates regularorthoepic transcription which is obtained by conversion rules. Exceptions from regular pronunciation can be marked by simple syntax so that forced alignment is finally provided on real phonetic contents of the utterance. The system is available for public usage.
Czech name
Fonetická segmetnace na bázi HMM v prostředí programu Praat
Czech description
Fonetická segmentace je požadována v mnoha aplikacích hlasových technologií. Jedna z nejčastěji používaných metod je založena na aplikaci zarovnání natrénovaných HMM modelů jednotlivých elementárních hlásek. Tento přístup byl použit i v realizovaném nástroji fonetické segmetnace na bázi HTK toolkitu, který byl integrován do prostředí programu Praat. Systém je aktuálně k disposici pro češtinu a požadovaným vstupem je známý obsah promluvy ve formě ortografického záznamu. Z uvedených vstupních údajů je vytvořena pravidelná výslovnost získaná pomoci pravidel převádějících ortografický záznam do ortoepické formy. Výjimky z pravidelné výslovnosti mohou být vyznačeny jednoduchou syntaxí v ortografickém záznamu v interaktivním režimu, takže zarovnání je následně realizováno pro skutečný obsah promluvy. Uvedený nástroj je volně dostupný.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/GA102%2F05%2F0278" target="_blank" >GA102/05/0278: New trends in research and application of voice technology</a><br>
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
The XII International Conference Speech and Computer - SPECOM 2007
ISBN
6-7452-0110-X
ISSN
—
e-ISSN
—
Number of pages
5
Pages from-to
537-541
Publisher name
Moskovskij gosudarstvennyj universitet im. M. V. Lomonosova
Place of publication
Moscow
Event location
Moskva
Event date
Oct 14, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—