SVIfT - Speaker Verification Interface for Tamas
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F21%3A10248485" target="_blank" >RIV/61989100:27240/21:10248485 - isvavai.cz</a>
Výsledek na webu
<a href="https://comtech.vsb.cz/download/projekt-mpo/Technicka_dokumentace_SVIfT_TAMASII.pdf" target="_blank" >https://comtech.vsb.cz/download/projekt-mpo/Technicka_dokumentace_SVIfT_TAMASII.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
SVIfT - Speaker Verification Interface for Tamas
Popis výsledku v původním jazyce
Software pro ověření identity pomocí biometrické autentizace. Implementovaný systém představuje biometrickou autentizaci, kde je pro ověření totožnosti použit hlas jako biometrická charakteristika. Jedná o biometrickou autentizaci s textovou výzvou, což znamená, že proces verifikace je doplněn o rozpoznávání izolovaných slov (konkrétně číslic). Rozšíření systému o tento blok vede k výraznému zvýšení bezpečnosti, kde je zajištěno, že identita osoby nemůže být podvržena prostřednictvím nahrávky. Systém je založen na nejmodernější metodách umělé inteligence, ať už pro samotnou verifikaci, nebo pro rozpoznání řeči. Díky těmto metodám je zajištěna maximální přesnost systému.
Název v anglickém jazyce
SVIfT - Speaker Verification Interface for Tamas
Popis výsledku anglicky
The implemented system represents biometric authentication, where voice is used as a biometric characteristic to verify identity. It is a biometric authentication with a text prompt, which means that the verification process is complemented by the isolated word recognition block (specifical numbers). Extending the system by this block leads to a significant increase in security, where it is ensured that a person's identity cannot be falsified through recording. The system is based on state-of-the-art artificial intelligence methods, either for verification itself or for speech recognition. Thanks to these methods, maximum system accuracy is ensured.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20200 - Electrical engineering, Electronic engineering, Information engineering
Návaznosti výsledku
Projekt
<a href="/cs/project/EG19_262%2F0020122" target="_blank" >EG19_262/0020122: Vývoj externích modulů TAMAS II</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
023/20-12-2021_SW
Technické parametry
Software zpracovává řečový signál o vzorkovací frekvenci 16kHz, který je následně rozdělen na tzv. segmenty o velikosti 25ms s překryvem 10ms. Na tyto segmenty je aplikovaná metoda Voice Activity Detection (VAD), která zajistí odstranění tichých částí řeči a tím zvýší přesnost klasifikace. Pro relevantní segmenty jsou poté extrahovány řečové parametry Mel-frequency cepstral coefficients MFCC (60), které dále slouží pro modelování Gaussian mixture model-universal background model (GMM-UBM). Klasifikační míra je určena jako rozdíl pravděpodobností, že ověřována nahrávka pochází od oprávněného řečníka a od řečníka z modelu UBM. Hodnota klasifikační míry je poté porovnána s rozhodovacím prahem. Výsledkem porovná je, zda má či nemá uživatel povelen přístup.
Ekonomické parametry
Hlavní přínos je v oblasti marketingu; konkurence dosud taková zařízení nevyrábí. Předpoklad ekonomického přínosu je výroba jednotek kusů po dokončení vývoje v roce 2022 při rámcové ceně 5000 EUR/ ks. Cíl je postupné navyšování dodávek v dalších letech.
IČO vlastníka výsledku
61989100
Název vlastníka
Vysoká škola báňská - Technická univerzita Ostrava