SW3 ASR for demanding acoustic conditions
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F23%3APR37715" target="_blank" >RIV/00216305:26230/23:PR37715 - isvavai.cz</a>
Alternative codes found
RIV/49777513:23520/23:43969270
Result on the web
<a href="https://www.fit.vut.cz/research/product/795/" target="_blank" >https://www.fit.vut.cz/research/product/795/</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
SW3 ASR pro akusticky náročná prostředí
Original language description
Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.
Czech name
SW3 ASR pro akusticky náročná prostředí
Czech description
Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Result continuities
Project
<a href="/en/project/VJ01010108" target="_blank" >VJ01010108: Robust processing of recordings for operations and security</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2023
Confidentiality
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Data specific for result type
Internal product ID
VJ01010108-V4
Technical parameters
Pro informace prosím kontaktujte: Ing. Martina Kocmanová, Výzkumné centrum informačních technologií, Fakulta informačních technologií VUT v Brně, Božetěchova 2, 612 66 Brno, tel. 541 141 466.
Economical parameters
Produkt vznikl v rámci vývojově-výzkumné činnosti na FIT VUT v Brně a ZCU Plzeň a byl plně financován z programu: STRATEGICKÁ PODPORA ROZVOJE BEZPEČNOSTNÍHO VÝZKUMU ČR 2019-2025 (IMPAKT 1), PODPROGRAMU 1: SPOLEČNÉ VÝZKUMNÉ PROJEKTY (BV IMP1/1VS), z projektu ev. č. VJ01010108 - Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ).
Owner IČO
00216305
Owner name
Vysoké učení technické v Brně