Detekce změny řečníka s využitím vzdálenostního přístupu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000083" target="_blank" >RIV/49777513:23520/05:00000083 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A metric-based approach to speaker change detection
Popis výsledku v původním jazyce
The paper deals with the problem of automatic speaker change detection. A new metric-based algorithm, called AlgBICMap algorithm, is proposed in this paper. The AlgBICMap algorithm allows to create a map of BIC (Bayessian Information Criterion), which enables us to detect efficiently fields of speech of individual speakers. In comparison with a typical metric-based approach, the advantage of the proposed algorithm is its robustness because it uses more information, not only information provided by adjacent windows. In addition to that, the AlgBICMap algorithm can be used also for speaker tracking tasks.
Název v anglickém jazyce
A metric-based approach to speaker change detection
Popis výsledku anglicky
The paper deals with the problem of automatic speaker change detection. A new metric-based algorithm, called AlgBICMap algorithm, is proposed in this paper. The AlgBICMap algorithm allows to create a map of BIC (Bayessian Information Criterion), which enables us to detect efficiently fields of speech of individual speakers. In comparison with a typical metric-based approach, the advantage of the proposed algorithm is its robustness because it uses more information, not only information provided by adjacent windows. In addition to that, the AlgBICMap algorithm can be used also for speaker tracking tasks.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F05%2F0278" target="_blank" >GA102/05/0278: Nové směry ve výzkumu a využití hlasových technologií</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2005
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Studientexte zur Sprachkommunikation
ISSN
0940-6832
e-ISSN
—
Svazek periodika
—
Číslo periodika v rámci svazku
—
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
8
Strana od-do
356
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—