Frequency-Domain Blind Speech Separation Using Incomplete De-Mixing Transform
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F16%3A00000308" target="_blank" >RIV/46747885:24220/16:00000308 - isvavai.cz</a>
Výsledek na webu
<a href="https://asap.ite.tul.cz/publications/conference-papers/" target="_blank" >https://asap.ite.tul.cz/publications/conference-papers/</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/EUSIPCO.2016.7760531" target="_blank" >10.1109/EUSIPCO.2016.7760531</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Frequency-Domain Blind Speech Separation Using Incomplete De-Mixing Transform
Popis výsledku v původním jazyce
We propose a novel solution to the blind speech separation problem where the demixing transform is estimated only within selected frequency bins. This solution is based on Independent Vector Analysis applied to a subset of instanta- neous mixtures, one per selected frequency bin. Next, two approaches are proposed to complete the transform: one based on null beamforming, and the other based on convex programming. In subsequent experiments, we compare combinations of both methods and evaluate their ability to retrieve the whole de-mixing transform. Depending on the number of selected frequencies and the sparsity of room impulse responses, the methods show improvements in terms of computational complexity as well as in terms of separation accuracy.
Název v anglickém jazyce
Frequency-Domain Blind Speech Separation Using Incomplete De-Mixing Transform
Popis výsledku anglicky
We propose a novel solution to the blind speech separation problem where the demixing transform is estimated only within selected frequency bins. This solution is based on Independent Vector Analysis applied to a subset of instanta- neous mixtures, one per selected frequency bin. Next, two approaches are proposed to complete the transform: one based on null beamforming, and the other based on convex programming. In subsequent experiments, we compare combinations of both methods and evaluate their ability to retrieve the whole de-mixing transform. Depending on the number of selected frequencies and the sparsity of room impulse responses, the methods show improvements in terms of computational complexity as well as in terms of separation accuracy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA14-11898S" target="_blank" >GA14-11898S: Zlepšování řečového signálu pomocí částečně slepých metod za použití pole mikrofonů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The 24th European Signal Processing Conference (EUSIPCO 2016)
ISBN
978-0-9928626-5-7
ISSN
2076-1465
e-ISSN
—
Počet stran výsledku
5
Strana od-do
1663-1667
Název nakladatele
European Signal Processing Conference, EUSIPCO
Místo vydání
Budapest, Hungary
Místo konání akce
Budapest, Hungary
Datum konání akce
1. 1. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000391891900319