SW3 ASR pro akusticky náročná prostředí
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F23%3APR37715" target="_blank" >RIV/00216305:26230/23:PR37715 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/49777513:23520/23:43969270
Výsledek na webu
<a href="https://www.fit.vut.cz/research/product/795/" target="_blank" >https://www.fit.vut.cz/research/product/795/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
SW3 ASR pro akusticky náročná prostředí
Popis výsledku v původním jazyce
Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.
Název v anglickém jazyce
SW3 ASR for demanding acoustic conditions
Popis výsledku anglicky
An Asian language speech recognition (ASR) system based on modern training approaches. The WAV2VEC model was trained on general recordings and retrained on Vietnamese recordings, further extended by data augmentation for demanding acoustic conditions. This achieved the desired robustness. Part of the result is a model for removing noise from the recording (deNoiser). The result is an application that uses a "Docker" container and can be run from the command line on a standard Linux or Windows distribution.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/VJ01010108" target="_blank" >VJ01010108: Robustní zpracování nahrávek pro operativu a bezpečnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
VJ01010108-V4
Technické parametry
Pro informace prosím kontaktujte: Ing. Martina Kocmanová, Výzkumné centrum informačních technologií, Fakulta informačních technologií VUT v Brně, Božetěchova 2, 612 66 Brno, tel. 541 141 466.
Ekonomické parametry
Produkt vznikl v rámci vývojově-výzkumné činnosti na FIT VUT v Brně a ZCU Plzeň a byl plně financován z programu: STRATEGICKÁ PODPORA ROZVOJE BEZPEČNOSTNÍHO VÝZKUMU ČR 2019-2025 (IMPAKT 1), PODPROGRAMU 1: SPOLEČNÉ VÝZKUMNÉ PROJEKTY (BV IMP1/1VS), z projektu ev. č. VJ01010108 - Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ).
IČO vlastníka výsledku
00216305
Název vlastníka
Vysoké učení technické v Brně