All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

SW2 - Waveform Denoiser

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F27680258%3A_____%2F17%3AN0000001" target="_blank" >RIV/27680258:_____/17:N0000001 - isvavai.cz</a>

  • Result on the web

    <a href="https://www.phonexia.com/en/cz-projects-grants/#drapak" target="_blank" >https://www.phonexia.com/en/cz-projects-grants/#drapak</a>

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    čeština

  • Original language name

    SW2 - Waveform Denoiser

  • Original language description

    Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.

  • Czech name

    SW2 - Waveform Denoiser

  • Czech description

    Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.

Classification

  • Type

    R - Software

  • CEP classification

  • OECD FORD branch

    20201 - Electrical and electronic engineering

Result continuities

  • Project

    <a href="/en/project/VI20152020025" target="_blank" >VI20152020025: Information mining in speech acquired by distant microphones - DRAPÁK</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2017

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Internal product ID

    DENOISE-cmd-D2.0

  • Technical parameters

    Systém Waveform Denoiser (verze D2.0) je připraven ve verzi pro příkazovou řádku pro operační systém MS Windows 64bit. Software je popsán manuálem. Vstupem je audio soubor (formát: MS Wave, (WAVE_FORMAT_PCM, IBM_FORMAT_MULAW, IBM_FORMAT_ALAW, WAVE_FORMAT_ADPCM), FLAC, RAW s lineárním kódováním 16bitů / 8bitů, vzorkovací frekvence 8kHz). Uživatel si může pomocí konfiguračního souboru (parametr “-c”) zvolit datový model pro verzi D2.0 (nový) nebo pro veri D1.0 (vytvořený v roce 2016). Program může zpracovat na vstupu: jeden soubor nebo seznam souborů nebo všechny soubory v zadaném adresáři. Na výstupu je generován audio soubor s příponou RAW nebo WAV (výchozí) ve formátu PCM S16 LE, 8kHz, 16bits). Při zpracování vstupních audií je používán popis hodnoty šumu pomocí SNR (signal-to-noise ratio). Uživatel v prostředí příkazového řádku vidí po zpracování každého souboru změnu SNR.

  • Economical parameters

    zvýšení zisku, export

  • Owner IČO

    27680258

  • Owner name

    Phonexia s.r.o