Investigation of Segmentation in i-Vector Based Speaker Diarization of Telephone Speech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43929715" target="_blank" >RIV/49777513:23520/16:43929715 - isvavai.cz</a>
Výsledek na webu
<a href="http://link.springer.com/chapter/10.1007%2F978-3-319-43958-7_49" target="_blank" >http://link.springer.com/chapter/10.1007%2F978-3-319-43958-7_49</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-43958-7_49" target="_blank" >10.1007/978-3-319-43958-7_49</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Investigation of Segmentation in i-Vector Based Speaker Diarization of Telephone Speech
Popis výsledku v původním jazyce
The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation.
Název v anglickém jazyce
Investigation of Segmentation in i-Vector Based Speaker Diarization of Telephone Speech
Popis výsledku anglicky
The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1506" target="_blank" >LO1506: Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech and Computer 18th International Conference, SPECOM 2016, Budapest, Hungary, August 23-27, 2016, Proceedings
ISBN
978-3-319-43957-0
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
8
Strana od-do
411-418
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Budapesť, Maďarsko
Datum konání akce
23. 8. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000389335600049