Regisztráció és bejelentkezés

Neurális háló alapú zenekategorizálás

Dolgozatunkban egy olyan tanuló algoritmust mutatunk be, amely képes különböző zeneszámokból információt kinyerni, és ez alapján szubjektív kategóriákba, műfajokba sorolni azokat, illetve egy számok közötti hasonlósági viszonyt is meghatározni. Ehhez a program először kiszámítja a Mel-frekvencia cepstrális együtthatókat (MFCC) az egyes hangfájlokból, majd megállapítja a dalok tempóját (BPM) is. Az így kapott értékekből egy, az adott számot leíró jellegvektort képzünk, amit le is normálunk. Ezt a normált jellegvektort kapja meg a neurális háló bemenetként, így ezt minden egyes feldolgozandó számhoz legeneráljuk.

A további működéshez két halmazba szedjük a számainkat, az egyik felükkel a neurális háló tanítását végezzük, míg a másik felüket tesztelésre használjuk. A háló kimenete az általunk előre megszabott négy csoport valamelyikébe osztja be a számot. Ez a négy csoport jelenleg a klasszikus, a rock, a rap, és egy egyéb. A teszteléshez és a tanításhoz felhasznált számok listájának összeállításánál több különböző kombinációt is megpróbáltunk, ezzel próbálva az algoritmus hatékonyságát különböző körülmények között tesztelni. A program eredményessége az adott számlista változatosságától függően a legrosszabb esetben 60%, a legjobb esetben pedig 90% volt.

szerzők

  • Szabó Dávid
    mechatronikai mérnöki
    nappali alapszak
  • Kristóf Tamás
    mechatronikai mérnöki
    nappali alapszak

konzulens

  • Kovács Viktor
    tanársegéd, Automatizálási és Alkalmazott Informatikai Tanszék