Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

SW2 - Waveform Denoiser

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F27680258%3A_____%2F17%3AN0000001" target="_blank" >RIV/27680258:_____/17:N0000001 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://www.phonexia.com/en/cz-projects-grants/#drapak" target="_blank" >https://www.phonexia.com/en/cz-projects-grants/#drapak</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    SW2 - Waveform Denoiser

  • Popis výsledku v původním jazyce

    Software Waveform Denoiser slouží k odstranění šumu a reverberace z nahrávky a zároveň k zesílení signálu řeči: ● primárně pro lepší srozumitelnost při poslechu lidmi ● sekundárně pro dosažení lepších výsledků automatickými technologiemi pro rozpoznávání řeči. V roce 2017 jsme dokončili nový model, který zajišťuje automatickou dereverberaci (odstranění ozvěn vzniklých snímáním zvuku v místnostech) a automatické odšumování řečového signálu. Nový datový model na pozadí Waveform Denoiser-u byl trénován na různé druhy šumů s využitím poslední generace algoritmů založených na neuronových sítích, s využitím více nahrávek v českém jazyce a dalším měření a zkušeností s odšumování. Tento nový způsob automaticky rekonstruuje řečový signál v různých druzích šumů v jedné nahrávce a poskytuje lepší výsledky při porovnání se standardními postupy obohacování řeči (“speech enhancement”), které jsou poloautomatické nebo manuální.

  • Název v anglickém jazyce

    SW2 - Waveform Denoiser

  • Popis výsledku anglicky

    Waveform Denoiser software is used to remove the noise and reverberation from the recording and to amplify the speech signal for: ● better understand-ability for listening by people ● achieving better results with automated speech recognition technologies In 2017, we have completed a new model that provides with automatic dereverberation (removing echoes from room sounds) and automatic speech signal rejection. The new Waveform Denoiser data model has been trained on various types of noise using the latest generation of neural network based algorithms, using multiple recordings in the Czech language. It is also based on further measurements and experiences. This new method automatically reconstructs the speech signal in different types of noise in one recording and provides better results when compared to standard speech or speech enhancement methods that are semi-automatic or manual.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    20201 - Electrical and electronic engineering

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/VI20152020025" target="_blank" >VI20152020025: Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony - DRAPÁK</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    DENOISE-cmd-D2.0

  • Technické parametry

    Systém Waveform Denoiser (verze D2.0) je připraven ve verzi pro příkazovou řádku pro operační systém MS Windows 64bit. Software je popsán manuálem. Vstupem je audio soubor (formát: MS Wave, (WAVE_FORMAT_PCM, IBM_FORMAT_MULAW, IBM_FORMAT_ALAW, WAVE_FORMAT_ADPCM), FLAC, RAW s lineárním kódováním 16bitů / 8bitů, vzorkovací frekvence 8kHz). Uživatel si může pomocí konfiguračního souboru (parametr “-c”) zvolit datový model pro verzi D2.0 (nový) nebo pro veri D1.0 (vytvořený v roce 2016). Program může zpracovat na vstupu: jeden soubor nebo seznam souborů nebo všechny soubory v zadaném adresáři. Na výstupu je generován audio soubor s příponou RAW nebo WAV (výchozí) ve formátu PCM S16 LE, 8kHz, 16bits). Při zpracování vstupních audií je používán popis hodnoty šumu pomocí SNR (signal-to-noise ratio). Uživatel v prostředí příkazového řádku vidí po zpracování každého souboru změnu SNR.

  • Ekonomické parametry

    zvýšení zisku, export

  • IČO vlastníka výsledku

    27680258

  • Název vlastníka

    Phonexia s.r.o