SW2 - Waveform Denoiser
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F27680258%3A_____%2F17%3AN0000001" target="_blank" >RIV/27680258:_____/17:N0000001 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.phonexia.com/en/cz-projects-grants/#drapak" target="_blank" >https://www.phonexia.com/en/cz-projects-grants/#drapak</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
SW2 - Waveform Denoiser
Popis výsledku v původním jazyce
Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.
Název v anglickém jazyce
SW2 - Waveform Denoiser
Popis výsledku anglicky
Waveform Denoiser software is used to remove the noise and reverberation from the recording and to amplify the speech signal for: ● better understand-ability for listening by people ● achieving better results with automated speech recognition technologies In 2017, we have completed a new model that provides with automatic dereverberation (removing echoes from room sounds) and automatic speech signal rejection. The new Waveform Denoiser data model has been trained on various types of noise using the latest generation of neural network based algorithms, using multiple recordings in the Czech language. It is also based on further measurements and experiences. This new method automatically reconstructs the speech signal in different types of noise in one recording and provides better results when compared to standard speech or speech enhancement methods that are semi-automatic or manual.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20201 - Electrical and electronic engineering
Návaznosti výsledku
Projekt
<a href="/cs/project/VI20152020025" target="_blank" >VI20152020025: Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony - DRAPÁK</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
DENOISE-cmd-D2.0
Technické parametry
Systém Waveform Denoiser (verze D2.0) je připraven ve verzi pro příkazovou řádku pro operační systém MS Windows 64bit. Software je popsán manuálem. Vstupem je audio soubor (formát: MS Wave, (WAVE_FORMAT_PCM, IBM_FORMAT_MULAW, IBM_FORMAT_ALAW, WAVE_FORMAT_ADPCM), FLAC, RAW s lineárním kódováním 16bitů / 8bitů, vzorkovací frekvence 8kHz). Uživatel si může pomocí konfiguračního souboru (parametr “-c”) zvolit datový model pro verzi D2.0 (nový) nebo pro veri D1.0 (vytvořený v roce 2016). Program může zpracovat na vstupu: jeden soubor nebo seznam souborů nebo všechny soubory v zadaném adresáři. Na výstupu je generován audio soubor s příponou RAW nebo WAV (výchozí) ve formátu PCM S16 LE, 8kHz, 16bits). Při zpracování vstupních audií je používán popis hodnoty šumu pomocí SNR (signal-to-noise ratio). Uživatel v prostředí příkazového řádku vidí po zpracování každého souboru změnu SNR.
Ekonomické parametry
zvýšení zisku, export
IČO vlastníka výsledku
27680258
Název vlastníka
Phonexia s.r.o