Speaker Diarization of Broadcast Audio Using Automatic Transcription, iVectors and Cosine Distance Scoring
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F12%3A%230002002" target="_blank" >RIV/46747885:24220/12:#0002002 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Speaker Diarization of Broadcast Audio Using Automatic Transcription, iVectors and Cosine Distance Scoring
Popis výsledku v původním jazyce
In this paper we present our system for speaker diarization of broadcast audio. In the system, segmentation of the processed spoken document utilizes an automatic transcription and speech segments determined by the speaker change point detector are represented by iVectors. Similarity of speech segments is evaluated using cosine distance scoring and linear discriminant analysis is applied to cope with intra-speaker variability. We demonstrate improvement of the performance over the baseline system employing methods based on the Bayesian Information Criterion (BIC). The presented speaker diarization system achieved 39.2% relative improvement of the diarization error rate over the baseline.
Název v anglickém jazyce
Speaker Diarization of Broadcast Audio Using Automatic Transcription, iVectors and Cosine Distance Scoring
Popis výsledku anglicky
In this paper we present our system for speaker diarization of broadcast audio. In the system, segmentation of the processed spoken document utilizes an automatic transcription and speech segments determined by the speaker change point detector are represented by iVectors. Similarity of speech segments is evaluated using cosine distance scoring and linear discriminant analysis is applied to cope with intra-speaker variability. We demonstrate improvement of the performance over the baseline system employing methods based on the Bayesian Information Criterion (BIC). The presented speaker diarization system achieved 39.2% relative improvement of the diarization error rate over the baseline.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA01011204" target="_blank" >TA01011204: Živé archivy</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proc. of 54th International Symposium ELMAR-2012
ISBN
978-1-4673-1243-1
ISSN
1334-2630
e-ISSN
—
Počet stran výsledku
4
Strana od-do
211-214
Název nakladatele
—
Místo vydání
Zadar, Chorvatsko
Místo konání akce
Zadar, Chorvatsko
Datum konání akce
1. 1. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—