Deepfake Speech Detection: A Spectrogram Analysis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F24%3APU150903" target="_blank" >RIV/00216305:26230/24:PU150903 - isvavai.cz</a>
Výsledek na webu
<a href="https://dl.acm.org/doi/10.1145/3605098.3635911" target="_blank" >https://dl.acm.org/doi/10.1145/3605098.3635911</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1145/3605098.3635911" target="_blank" >10.1145/3605098.3635911</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Deepfake Speech Detection: A Spectrogram Analysis
Popis výsledku v původním jazyce
The current voice biometric systems have no natural mechanics to defend against deepfake spoofing attacks. Thus, supporting these systems with a deepfake detection solution is necessary. One of the latest approaches to deepfake speech detection is representing speech as a spectrogram and using it as an input for a deep neural network. This work thus analyzes the feasibility of different spectrograms for deepfake speech detection. We compare types of them regarding their performance, hardware requirements, and speed. We show the majority of the spectrograms are feasible for deepfake detection. However, there is no general, correct answer to selecting the best spectrogram. As we demonstrate, different spectrograms are suitable for different needs.
Název v anglickém jazyce
Deepfake Speech Detection: A Spectrogram Analysis
Popis výsledku anglicky
The current voice biometric systems have no natural mechanics to defend against deepfake spoofing attacks. Thus, supporting these systems with a deepfake detection solution is necessary. One of the latest approaches to deepfake speech detection is representing speech as a spectrogram and using it as an input for a deep neural network. This work thus analyzes the feasibility of different spectrograms for deepfake speech detection. We compare types of them regarding their performance, hardware requirements, and speed. We show the majority of the spectrograms are feasible for deepfake detection. However, there is no general, correct answer to selecting the best spectrogram. As we demonstrate, different spectrograms are suitable for different needs.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the ACM Symposium on Applied Computing
ISBN
979-8-4007-0243-3
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
1312-1320
Název nakladatele
Association for Computing Machinery
Místo vydání
Avila
Místo konání akce
Avila
Datum konání akce
8. 4. 2024
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
001236958200192