Neurális architektúra keresés minta-hatékonyságának javítása megerősítéses tanulással

Az elmúlt évtized deep learning forradalmának egyik legfőbb mozgatórugója az összetett architektúrák megtervezése és implementálása volt. Amikor adat alapú megközelítéssel igyekszünk megoldani egy bonyolult problémát, bevált módszer egy már jól működő, neves szakértők által megalkotott architektúra (pl. Inception) felhasználása. Ez néhány esetben elegendő, de jelenleg az igazán összetett feladatokon nagy pontosságot csak magasan képzett deep learning szakemberek segítségével lehet elérni.

Munkánkban az automatizált gépi tanulás területéhez szeretnénk hozzájárulni, azon belül is a neurális architektúrák kereséséhez. Ezekkel a módszerekkel bonyolult, probléma-specifikus architektúrák tervezése is lehetséges komoly háttértudás nélkül, ennélfogva a társadalom szélesebb körben tudja kihasználni a mély tanulásban rejlő lehetőségeket. Habár az elmúlt években számos ilyen módszer (pl gradiens alapú vagy evolúciós algoritmus) jelent meg, dolgozatunkban a megerősítéses tanuláson alapuló megközelítéssel foglalkozunk. Ebben az esetben egy rekurrens neurális hálót (kontroller) tanítunk probléma-specifikus neurális háló architektúrák generálására. A generált hálók validációs pontossága képezi a kontroller megerősítéses tanulással való tanítása során használt jutalom függvényt.

Munkánk alapját képezi az Efficient Neural Architecture Search (ENAS) algoritmus, amelyben súly megosztást alkalmaznak a generált architektúrák között. Az ENAS, mint sok más megerősítéses tanuláson alapuló megközelítés a generált architektúrák konvergenciáján igyekszik javitani. A kontroller így sűrűbb jutalom függvényhez jut, ezáltal lecsökkentve a tanítás idejét. Dolgozatunkban a probléma másik oldalát közelítjük meg, vagyis a kontroller tanításán szeretnénk javítani. A kontroller eredetileg a REINFORCE algoritmus alapján tanult, mi ezt egy korszerűbb megerősítéses tanulásra, a PPO-ra cseréljük le, ami más problémakörökben stabilabb és gyorsabb tanulást eredményezett. Ezután a kapott eredményeket részletesen vizsgáljuk annak fényében, hogy képes-e ezáltal kevesebb generált architektúra felhasználásából, tehát gyorsabban tanulni.

Dolgozatunkban képek osztályozására keresünk neurális háló architektúrákat a CIFAR-10 adathalmazon tanítva. Az algoritmusokat a nyílt forráskódú Pytorch mély tanulásos keretrendszerben implementáltuk.

szerzők

Nagy Attila
Mérnök informatikus szak, alapképzés
alapképzés (BA/BSc)
Boros Ábel
Mérnök informatikus szak, alapképzés
alapképzés (BA/BSc)

konzulensek

Abed Hamdi
Ph.D. researcher, Távközlési és Médiainformatikai Tanszék
Dr. Gyires-Tóth Bálint
adjunktus, Távközlési és Médiainformatikai Tanszék

helyezés

I. helyezett

letöltés
1 413 kB