Unsupervised Feature Pre-training of the Scattering Wavelet Transform for Musical Genre Recognition
PBN-AR
Instytucja
Wydział Informatyki (Polsko-Japońska Akademia Technik Komputerowych)
Informacje podstawowe
Główny język publikacji
EN
Czasopismo
Procedia Technology
ISSN
2212-0173
EISSN
Wydawca
ELSEVIER SCIENCE BV
DOI
URL
Rok publikacji
2014
Numer zeszytu
Strony od-do
133–139
Numer tomu
18
Identyfikator DOI
Liczba arkuszy
0,32
Autorzy
(liczba autorów: 2)
Słowa kluczowe
EN
musical genre recognition
deep learning
scattering wavelet transform
autoencoders
neural networks
Konferencja
Indeksowana w Scopus
nie
Indeksowana w Web of Science Core Collection
tak
Liczba cytowań z Web of Science Core Collection
Nazwa konferencji (skrócona)
IICST 2014
Nazwa konferencji
International workshop on Innovations in Information and Communication Science and Technology
Początek konferencji
2014-09-03
Koniec konferencji
2014-09-05
Lokalizacja konferencji
Warszawa
Kraj konferencji
PL
Lista innych baz czasopism i abstraktów w których była indeksowana
Streszczenia
Język
EN
Treść
This paper examines the utilization of Sparse Autoencoders (SAE) in the process of music genre recognition. We used Scattering Wavelet Transform (SWT) as an initial signal representation. The SWT uses a sequence of Wavelet Transforms to compute the modulation spectrum coefficients of multiple orders which was already shown to be promising for this task. The Autoencoders can be used for pre-training a deep neural network, treated as an features detector, or used for dimensionality reduction. In this paper, SAEs were used for pre-training deep neural network on the data obtained from jamendo.com website offering music on creative commons licence. The pre-training phase is performed in unsupervised manner. Next, the network is fine-tuned in supervised way with respect to the genre classes. We used GTZAN database for fine-tuning the network. The results are compared with those obtained with training neural network in a standard way (with random weights initialization).
Inne
System-identifier
PX-56b46aeb8106eb71826e8e9f
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych