Regisztráció és bejelentkezés

Független komponens analízis alapú akusztikus nyalábformálás

A műszaki gyakorlatban igen nagy múltra tekintő jelfeldolgozási probléma az úgynevezett vak forrásszeparálás (Blind Source Separation, továbbiakban BSS) problémaköre. Ez formálisan azt jelenti, hogy a bizonyos jeleket nincs lehetőségünk "külön-külön" szeparáltan megfigyelnünk, mindössze valamilyen ismeretlen keverő rendszer által alkotott, gyakran zajjal terhelt keveréküket tudjuk mérni, a feladat pedig ezek minél hatékonyabb szétválasztása. Mivel a probléma nagy gyakorlati jelentőséggel rendelkezik, többek között a telekommunikáció, az orvosi jelfeldolgozás, illetve az akusztika területén, az elmúlt évtizedekben jelentős szakirodalma született a BSS probléma különböző változatainak.

Adott emellett egy másik, leginkább az akusztikus és rádiós jelfeldolgozás területén felmerülő probléma, az úgynevezett nyalábformálás (beamforming). Az ezen dolgozat által részletesebben tárgyalt akusztikus nyalábformálás feladata, hogy egy ismert geometriájú mikrofon tömböt felhasználva meghatározzuk a hangtér forrásainak relatív irányát, illetve az adott forrásokra fókuszálva minél inkább szeparálni tudjuk azokat.

A föntebbi két probléma első ránézésre igen hasonlónak tűnik, felmerülhet a kérdés, hogy a klasszikus BSS technikák mennyire jól adaptálhatók akusztikus beamforming céljára. Ezen dolgozat keretében erre a kérdésre keressük a választ, azaz egy BSS módszerre alapuló akusztikus nyalábformáló megoldás megvalósítását vizsgáljuk mely képes mikrofontömbös akusztikus mérésekből történő forráslokalizáció valamint forrásszeparáció céljára.

Megvizsgáljuk a valós akusztikus környezetekben, így a nyalábformálási probléma esetén is létrejövő, konvolutív keverékekre használható, a szakirodalom által leginkább elfogadott BSS technikát, a frekvenciatartománybéli független komponens analízist (FD-ICA), illetve az ennek alapjául szolgáló komplex független komponens analízis (complex ICA) megvalósításának lehetőségeit. Áttekintjük, hogy a mikrofontömbös mérés sajátosságai (az ismert mikrofonpozíciók, és a források számánál jelentősen nagyobb számú mikrofon) milyen többletinformációkat nyújtanak a klasszikus BSS konfigurációkkal szemben, ezeket hogyan lehetséges a klasszikus BSS módszerek gyengeségeinek kiküszöbölésére felhasználni, illetve megvizsgáljuk a "klasszikus" mikrofontömbös nyalábformálási technikák felhasználhatóságát az FD-ICA keretben.

Ezek alapján javaslunk egy új, mikrofontömbös környezetre adaptált FD-ICA alapú forrásszeparációs algoritmust, majd ezt Python környezetben implementáljuk. A javasolt megoldás szeparációs teljesítményét kiértékeljük szimulált, illetve valós mikrofontömbös méréseken. Kimérjük a sok mikrofon használatának jelentőségét, illetve összehasonlítjuk a megoldásunk teljesítményét a mikrofontömbös mérési gyakorlatban használt klasszikus beamforming technikák szeparációs teljesítményével.

szerző

  • Tóth Máté
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Fiala Péter
    Docens, Hálózati Rendszerek és Szolgáltatások Tanszék

helyezés

I. helyezett