Rozpoznání titulu gramofonové desky podle krátké ukázky
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F17%3A00315796" target="_blank" >RIV/68407700:21230/17:00315796 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.humusoft.cz/ftp/www/papers/tcp2017/026_moldan.pdf" target="_blank" >http://www.humusoft.cz/ftp/www/papers/tcp2017/026_moldan.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Rozpoznání titulu gramofonové desky podle krátké ukázky
Popis výsledku v původním jazyce
Tento článek popisuje návrh a implementaci vlastního řešení pro úlohu identifikace nahrávky, se zaměřením na identifikaci nahrávek z gramofonové desky. Algoritmus je implementován v programovém prostředí MATLAB. Pro klasifikaci nahrávky a vyhledávání v databázi nahrávek je zvolena metoda strojového učení K-nearest neighbors (k-nejbližších sousedů, KNN). Pro parametrizaci nahrávky je použito již připravených parametrů z Music Information Retrieval (MIR) Toolboxu, nahrávka je klasifikována pomocí parametrů tempo a mode. Pro testování algoritmu byla jako vedlejší funkcionalita programu vytvořena možnost přidat typické zvukové atributy gramofonových desek do existujících nahrávek. Po natrénování na množině všech 269 dostupných masterů nahrávek byl program schopen rozpoznat 92,8 % nahrávek uměle znehodnocených atributy gramofonové desky (posunutí začátku, snížení amplitudy, přidání šumu a ztráta vysokých frekvencí) a zároveň všech 5 dostupných nahrávek pořízených z gramofonové desky. Pro ovládání programu bylo také vytvořené jednoduché grafické rozhraní
Název v anglickém jazyce
Vinyl Record Title Identification Based on Short Sound Sample
Popis výsledku anglicky
The article deals with the design and implementation of an original solution for the audio records recognition, aimed to vinyl record title recognition. The MATLAB algorithm is implemented. The implemented solution is using K-nearest Neighbors (KNN) machine learning algorithm. Each audio record in this project is characterized by set of parameters from MIR Toolbox. The tempo and mode parameters are used. To find the most helpful parameters for this task, more parameters from MIR Toolbox were tested on audio records artificially affected by vinyl disc attributes. Being trained with set of 269 available master records, algorithm was able to successfully identify 92,8 % records with artificially simulated attributes of vinyl records and also all 5 records which were recorded from real vinyl discs. Simple graphical user interface was added.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20201 - Electrical and electronic engineering
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
24 th Annual Conference Proceedings Technical Computing Prague 2017
ISBN
978-80-7592-002-7
ISSN
2336-1662
e-ISSN
—
Počet stran výsledku
8
Strana od-do
1-8
Název nakladatele
HUMUSOFT s.r.o.
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
8. 11. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—