SW2 - Waveform Denoiser
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F27680258%3A_____%2F17%3AN0000001" target="_blank" >RIV/27680258:_____/17:N0000001 - isvavai.cz</a>
Result on the web
<a href="https://www.phonexia.com/en/cz-projects-grants/#drapak" target="_blank" >https://www.phonexia.com/en/cz-projects-grants/#drapak</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
SW2 - Waveform Denoiser
Original language description
Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.
Czech name
SW2 - Waveform Denoiser
Czech description
Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20201 - Electrical and electronic engineering
Result continuities
Project
<a href="/en/project/VI20152020025" target="_blank" >VI20152020025: Information mining in speech acquired by distant microphones - DRAPÁK</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2017
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
DENOISE-cmd-D2.0
Technical parameters
Systém Waveform Denoiser (verze D2.0) je připraven ve verzi pro příkazovou řádku pro operační systém MS Windows 64bit. Software je popsán manuálem. Vstupem je audio soubor (formát: MS Wave, (WAVE_FORMAT_PCM, IBM_FORMAT_MULAW, IBM_FORMAT_ALAW, WAVE_FORMAT_ADPCM), FLAC, RAW s lineárním kódováním 16bitů / 8bitů, vzorkovací frekvence 8kHz). Uživatel si může pomocí konfiguračního souboru (parametr “-c”) zvolit datový model pro verzi D2.0 (nový) nebo pro veri D1.0 (vytvořený v roce 2016). Program může zpracovat na vstupu: jeden soubor nebo seznam souborů nebo všechny soubory v zadaném adresáři. Na výstupu je generován audio soubor s příponou RAW nebo WAV (výchozí) ve formátu PCM S16 LE, 8kHz, 16bits). Při zpracování vstupních audií je používán popis hodnoty šumu pomocí SNR (signal-to-noise ratio). Uživatel v prostředí příkazového řádku vidí po zpracování každého souboru změnu SNR.
Economical parameters
zvýšení zisku, export
Owner IČO
27680258
Owner name
Phonexia s.r.o