Neurális háló alapú zenekategorizálás
Dolgozatunkban egy olyan tanuló algoritmust mutatunk be, amely képes különböző zeneszámokból információt kinyerni, és ez alapján szubjektív kategóriákba, műfajokba sorolni azokat, illetve egy számok közötti hasonlósági viszonyt is meghatározni. Ehhez a program először kiszámítja a Mel-frekvencia cepstrális együtthatókat (MFCC) az egyes hangfájlokból, majd megállapítja a dalok tempóját (BPM) is. Az így kapott értékekből egy, az adott számot leíró jellegvektort képzünk, amit le is normálunk. Ezt a normált jellegvektort kapja meg a neurális háló bemenetként, így ezt minden egyes feldolgozandó számhoz legeneráljuk.
A további működéshez két halmazba szedjük a számainkat, az egyik felükkel a neurális háló tanítását végezzük, míg a másik felüket tesztelésre használjuk. A háló kimenete az általunk előre megszabott négy csoport valamelyikébe osztja be a számot. Ez a négy csoport jelenleg a klasszikus, a rock, a rap, és egy egyéb. A teszteléshez és a tanításhoz felhasznált számok listájának összeállításánál több különböző kombinációt is megpróbáltunk, ezzel próbálva az algoritmus hatékonyságát különböző körülmények között tesztelni. A program eredményessége az adott számlista változatosságától függően a legrosszabb esetben 60%, a legjobb esetben pedig 90% volt.
szerzők
-
Szabó Dávid
mechatronikai mérnöki
nappali alapszak -
Kristóf Tamás
mechatronikai mérnöki
nappali alapszak
konzulens
-
Kovács Viktor
tanársegéd, Automatizálási és Alkalmazott Informatikai Tanszék