Regisztráció és bejelentkezés

Mély neurális hálózatok hatékony ritkítása modell alapú megerősítéses tanulás alkalmazásával

A mély neurális hálók az elmúlt tíz évben kimagasló eredményt mutattak az objektumdetektálás területén, alkalmazásuknak azonban gátat szab a nagy számításikapacitás-igényük és méretük, mely a hatalmas paraméterszámukkal magyarázható. Különösen jelentős ez a probléma az erőforráskorlátos eszközök esetén (pl. mobiltelefonok, beágyazott rendszerek), ahol még a betanított modellek tárolása és futtatása is nehézséget okozhat. A probléma megoldására használatos a ritkítás (ún. pruning eljárás), melynek célja egy neurális háló modell paramétereinek lehető legnagyobb mértékű redukálása a pontosság romlásának elkerülése mellett.

Az eltávolítandó paraméterek kiválasztását jelentősen megnehezíti az, hogy a modell különböző rétegei nem egyformán érzékenyek a paraméterek törlésére. További nehezítő tényező, hogy a redukált modell pontosságromlását nem csak az éppen ritkítandó réteg érzékenysége befolyásolja, hanem az azt megelőző rétegek redukálásának mértéke is. A mély neurális háló modellekben ezen összefüggések feltérképezése a lehetséges variációk hatalmas száma miatt kézzel lehetetlen, csupán feltételezésekre támaszkodhatunk.

A probléma megközelíthető megerősítéses tanulás alkalmazásával, melynek során az ágens emberi beavatkozás nélkül igyekszik megtalálni az optimális eltávolítandó paraméterszámot a modell minden rétegéhez. A probléma ezen megközelítése jelenleg is nyitott téma az irodalomban, ám a létező megoldások legnagyobb hátulütője, hogy az ágens számára a két legfontosabb környezeti változást, a paramétersűrűséget és a pontosságromlást a modell tényleges ritkításával és a redukált modell validációs adatbázison való tesztelésével határozzák meg futási időben, ami nagymértékben lelassítja a tanítási folyamatot.

Munkám során egy olyan megerősítéses tanulás alapú rendszert valósítok meg, mely a YOLOv4 objektumdetektor optimális ritkítását teszi lehetővé a tanítási folyamat idejének csökkentése mellett. Az eddig létező megoldásokhoz képest a rendszert egy olyan neurális hálóval egészítem ki, mely a ritkítandó háló pontosságváltozását és paramétersűrűségét képes megbecsülni az addig törölt paraméterek mennyiségének és az adott réteghez választott redukáló tényező függvényében. Ezen állapotbecslő háló a környezet állapotának meghatározásához szükséges hosszadalmas műveletek szerepét veszi át, nagyságrendekkel növelve így a tanítás sebességét. Az állapotbecslő hálót önfelügyelt tanítás segítségével tanítom be, automatikusan generált adatok segítségével.

A megvalósított módszer eredményei a futási idő és a pontosság- és paramétersűrűség-változás tekintetében state-of the-art pruning módszerekkel kerülnek összevetésre.

szerző

  • Bencsik Blanka
    Villamosmérnöki szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Szemenyei Márton
    Adjunktus, Irányítástechnika és Informatika Tanszék

helyezés

Knorr-Bremse VJRH Kft I. helyezett