A metric-based approach to speaker change detection
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000083" target="_blank" >RIV/49777513:23520/05:00000083 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
A metric-based approach to speaker change detection
Original language description
The paper deals with the problem of automatic speaker change detection. A new metric-based algorithm, called AlgBICMap algorithm, is proposed in this paper. The AlgBICMap algorithm allows to create a map of BIC (Bayessian Information Criterion), which enables us to detect efficiently fields of speech of individual speakers. In comparison with a typical metric-based approach, the advantage of the proposed algorithm is its robustness because it uses more information, not only information provided by adjacent windows. In addition to that, the AlgBICMap algorithm can be used also for speaker tracking tasks.
Czech name
Detekce změny řečníka s využitím vzdálenostního přístupu
Czech description
Článek se zabývá problémem automatické detekce změny řečníka. Je navržen nový vzdálenostní algoritmus nazývaný AlgBICMap. Tento algoritmus umožňuje vytvořit BIC (Bayessovské informační kritérium) mapu, která nám dovoluje účinně detekovat oblasti řeči jednotlivých řečníků. Ve srovnání s typickými vzdálenostními přístupy spočívá výhoda navrženého algoritmu v jeho robustnosti, protože algoritmus užívá více informace, nejen informaci poskytnutou sousedními okny. Navíc AlgBICMap algoritmus lze využít také pro úlohy sledování řečníka.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/GA102%2F05%2F0278" target="_blank" >GA102/05/0278: New trends in research and application of voice technology</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Studientexte zur Sprachkommunikation
ISSN
0940-6832
e-ISSN
—
Volume of the periodical
—
Issue of the periodical within the volume
—
Country of publishing house
DE - GERMANY
Number of pages
8
Pages from-to
356
UT code for WoS article
—
EID of the result in the Scopus database
—