Imitációs tanulás a Duckietown környezetben

Napjainkban egyre nagyobb figyelem irányul az önvezető autókra és a vezetést támogató rendszerekre mind az ipar, mind a kutatás területéről. Ennek következtében egyre több jármű tartalmaz modern biztonsági funkciókat, ezáltal a közlekedés is egyre biztonságosabbá és hatékonyabbá válik. A nagymértékben megnövekedett számítási kapacitásnak, illetve a gépi tanulás területén elért kutatási eredményeknek köszönhetően a korszerű vezetést támogató megoldások többsége mély tanuláson alapul.

A mély tanulás egyik alterülete az imitációs tanulás, mely során a tanuló algoritmus az adott feladat megoldásához szükséges optimális stratégiát egy szakértő demonstrációin keresztül tanulja meg, ezáltal tulajdonképpen utánozza, “imitálja” a szakértő viselkedését. A módszer sajátossága, hogy a tanításhoz nem felcímkézett adatokra, hanem a feladat elvégzése során készített demonstációkra van szükség. Ezek generálása bizonyos problémák esetén sokkal egyszerűbb és kevésbé költséges, mint a tanító adatok felcímkézése. Ez különösen igaz az önvezető autókra, ahol a szükséges demonstrációk összegyűjthetők közönséges vezetéssel is.

Munkám során a Duckietown környezet szimulátorában vizsgáltam meg különböző, imitációs tanuláson alapuló algoritmusokat. Az említett környezet egy nyílt forráskódú platform, melyben különféle önvezető feladatokat oldhatunk meg. Az ágensek kamerával felszerelt differenciális hajtású robotok, melyek a miniatűr városokban közlekednek. Az általam megvalósított feladat a sávkövetés volt.

Dolgozatomban először bemutatom a szakirodalmat: az imitációs tanulás különböző fajtáit és az egyes módszereket, algoritmusokat. Ezt követően ismertetem a Duckietown környezetet, az egyes feladatokat és a kiértékeléshez szükséges metrikákat. Ezután bemutatom az általam felhasznált imitációs tanuláson alapuló algoritmusokat, ezek implementálásának részleteit, a felhasznált modelleket, a tanítás menetét és az egyes algoritmusokkal elért eredményeket. Végül összehasonlítom az egyes algoritmusokat az általuk elért eredmények alapján.

szerző

Lőrincz Zoltán
Villamosmérnöki szak, mesterképzés
mesterképzés (MA/MSc)

konzulensek

Dr. Szemenyei Márton
Adjunktus, Irányítástechnika és Informatika Tanszék
Moni Róbert
PhD student, Távközlési és Médiainformatikai Tanszék

helyezés

II. helyezett

letöltés
1 505 kB