Multi-ágens Megerősítéses Tanulás alkalmazása autópályás döntéshozatal esetére

Az elmúlt évtized során a hagyományos, egyágenses Megerősítéses Tanulás először a társas-, és videójátékok, valamint a robotika területén került felhasználásra. A módszer széles körben történő alkalmazását a komplex döntéshozatali feladatok megoldására való képesség nagy mértékben segítette, mely által az autonóm járműirányításban is elterjedtté vált. Az ilyen algoritmusok ígéretes eredményeket mutatnak a saját tanítási környezetükben, azonban az egyedül tanított ágensek viselkedése kifogásolhatóvá válik más ágensekkel történő találkozáskor. Ezen probléma kiküszöbölésére használható a multi-ágens Megerősítéses Tanulás, melynek számos fajtája közül az ún. Double DQN algoritmust alkalmaztam a kutatásom során, mely a népszerű DQN algoritmus túlbecslési problémáját küszöböli ki. A tanítást a HighwayEnv szimulációs környezetben végeztem, mely a többsávos autópályás haladás során történő döntéshozatali szituációk egyszerű modellezésére szolgál.

A dolgozatom célja, hogy rávilágítson a multi-ágens Megerősítéses Tanulás előnyeire az autonóm járműirányításban. Ehhez az egy- és többágenses algoritmusok teljesítménye egy vegyes, azaz ágenseket és előre meghatározott viselkedésű járműveket is tartalmazó környezetben kerül összevetésre. Ezen felül az ágensek számára visszacsatolt állapotreprezentációban szereplő tényezők hatását is tanulmányozom. Végül pedig a különböző jutalmazással végzett tanítások eredményei kerülnek összehasonlításra.

szerző

Gujgiczer Dániel Tamás
Járműmérnöki
alapképzés (BA/BSc)

konzulens

Dr. Szabó Ádám
Tudományos munkatárs, Közlekedés- és Járműirányítási Tanszék

helyezés

II. helyezett

letöltés
2 142 kB