Időbeli információ integrálása mély megerősítéses tanulásban sávkövetési funkció javítására

Napjainkban az autóipar egyik legtöbbet kutatott területe az autonóm vezetés. A technológiai fejlesztések fő célja a teljes automatizálás elérése, ezáltal a közúti balesetek számának és súlyosságának csökkentése, valamint a légkör szennyezésének csökkentése. Ezen célok elérése érdekében fejlett vezetéstámogató rendszereket szükséges kialakítani és fejleszteni.

A gépi tanulás, és különösen a mélytanulás, bizonyítottan hatékony megoldásnak mutatkozik a vezetést támogató funkciók megvalósítására. Ezt láthatjuk az ipari trendekben, akár a kamerák, radarok, lidarok jelfeldolgozását, akár a járművek döntéshozatalát és vezérlését vizsgáljuk. Kimondható, hogy jelenleg elképzelhetetlen lenne az önvezető járművek megvalósítása adatközpontú megoldások nélkül.

Az autonóm vezetésnél egyetlen mérés nem ad minden esetben kielégítő minőségű és mennyiségű információt, mivel figyelembe kell vennünk a járművek és a környezet dinamikáját is. Több mintavétel együttes figyelése közvetett dinamikai információt hordozhat, amely pontosabb döntésekhez vezetheti a modellt. A környezet ilyen állapotainak és az ezekből kiadott irányítási jeleknek a modellezésére szokványosan konvolúciós (CNN) és rekurrens neurális hálózatokat (RNN) alkalmaznak.

Ezen dolgozat a szekvenciamodellezési képességekkel rendelkező mélytanulási modellek teljesítményének vizsgálatáról és kiértékeléséről szól. Az összehasonlítás során különös figyelmet kap a különböző modellek azonos környezetben, azonos körülmények között történő tanítása és tesztelése. A modellek a sávkövetési feladatra tanítása mély megerősítéses tanulással történt, azon belül Proximal Policy Optimization algoritmussal. Az ágensek a sávkövetést egy szimulációban, pontosabban a Duckietown környezetben tanulták.

Az összehasonlítás alapját egy olyan CNN modell fogja adni amely ezen felhasználásában nem rendelkezik szekvencia modellezési képességekkel. A további megvizsgált modellek hybrid modellek, melyek egy CNN és egy szekvencia modellből fognak állni. Az integrált modellek long-short term memory és transformer lesznek. Az összehasonlítás különböző sávkövetési teljesítménymutatók, továbbá a szükséges tanítási iterációk száma, a következtetési idő és a számítási igény alapján lesz elvégezve. A dolgozat további célja, hogy analizálja és kiértékelje az összehasonlítások eredményeit.

szerző

Tóth Tibor Áron
Járműmérnöki
mesterképzés (MA/MSc), nappali

konzulensek

Dr. Gyires-Tóth Bálint
adjunktus, Távközlési és Médiainformatikai Tanszék
Moni Róbert
PhD student, Távközlési és Médiainformatikai Tanszék

helyezés

Continental Automotive Hungary Kft I. helyezett

letöltés
12 269 kB