Regisztráció és bejelentkezés

Akkordfelismerés rejtett Markov-modelles megközelítésben

A Music Information Retrieval (MIR) interdiszciplináris tudományterület, melynek célja a zenében lévő információk kinyerése. A MIR többek között a jelfeldolgozást, gépi tanulást, zenetudományt és még a pszichológiát is magába foglalja. Többféle zenei információt ismerhetünk fel, csakúgy, mint hangnem, tempó, akkordok, vagy akár a konkrét zenei hangokat is, ez utóbbi gépi kottázáshoz, transzkripcióhoz használható. Dolgozatomban alapvetően az akkordfelismeréssel foglalkoztam, de ennek kapcsán hangnem- és tempófelismerés megvalósítására is szükség volt.

Az akkord a nyugati zene sajátossága. Egyszerűen megfogalmazva azt mondhatjuk, hogy az akkord több hang egyidejű megszólalása, ami együtt egyfajta harmóniát ad. Egy gyakorlott zenész képes lehet arra, hogy hallás alapján felismerje az egyes akkordokat. Kevésbé gyakorlott zenészeknek - akik nem rendelkeznek még ezzel a képességgel - nagy segítség lehet egy akkordfelismerő szoftver. Egy ilyen alkalmazással könnyebben meg lehet tanulni olyan zenéket, amihez nem áll rendelkezésre kotta, vagy ez alapján akár zenei transzkripciót, feldolgozást is könnyebben lehet készíteni. Egy ilyen program a zenei oktatásban is nagy segítség lehet, például arra, hogy ezáltal jobban megértsük a zenei szerkezeteket, hogy tanulmányozhassuk, és gyorsabban elsajátíthassuk a komponálási módszereket, adott stílusok jellegzetességeit, akkordmeneteit. Ezenkívül egy jól működő akkordfelismerő program magába foglalja annak a lehetőségét, hogy nagyméretű zenei adatbázist készítsünk, mely alkalmas lehet további gépi tanításra például zenei stílus felismerés vagy zenei improvizáció készítés kapcsán.

Az akkordfelismerés egy ma is folyamatosan fejlődő kutatási terület, teljesen egzakt algoritmus, mely tévesztés nélkül működne, még nem készült. Az eddig elkészült alkalmazásokban többféle módszerrel próbálkoztak, ilyen pl. a Rejtett Markov-modelles megközelítés, mintamegfeleltetés, neurális hálózatokkal való tanítás. Ezen kívül az egyes munkákban különböző kisebb, az algoritmus hatásfokát javító heurisztikák is találhatók. A megfelelő algoritmus kutatása során több, viszonylag újszerű matematikai fogalommal kellett megismerkednem, úgymint az elvárásmaximalizáció, Rejtett Markov-modell, Viterbi-algoritmus, neurális hálózat és a fuzzy logika. Ezen módszerek az emberi döntéshozatalt próbálják matematikailag modellezni, jellemzően valószínűségi módszerek alkalmazásával. Mivel az egyszerű jelfeldolgozást alkalmazó módszerek nem tűntek elég hatékonynak, dolgozatomban az akkordfelismerést Rejtett Markov-modelles irányból közelítettem meg. Ehhez a szakirodalomban leírt eszközöket használtam fel, és azt fejlesztettem tovább saját ötleteken alapuló módszerekkel. Az elkészült programot Matlab környezetben implementáltam és annak pontosságát egy megfelelően nagyméretű zenei adatbázison teszteltem.

szerző

  • Pirkó Balázs
    Villamosmérnöki szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Bank Balázs
    docens, Méréstechnika és Információs Rendszerek Tanszék