Regisztráció és bejelentkezés

RRT és Megerősítéses Tanulás kombinálása trajektória követés esetére

Az önvezetés napjaink egyik legelterjedtebb témaköre a járműfejlesztésben. Ebben nagy szerepet játszik a forgalom mennyiségének és ezáltal komplexitásának növekedése, illetve az ezt lehetővé tevő számítókapacitás növekedése. A teljes önvezetés megvalósítása még sok akadályt jelent számunkra, ezt főként a közlekedés bonyolultsága okozza. Emiatt jutott nagy szerephez a gépi tanulással való fejlesztés az utóbbi időkben. A gépi tanuláson belül a Megerősítéses Tanulással foglalkoztam. Ennek egyik fő oka, hogy rengeteg lehetőséget nyújt és sokkal kevésbé korlátos, mint ismert társa, a felügyelt tanulás. Illetve nincs szükség óriási címkézett adathalmazra sem. Ellenben számos kihívás áll előttünk a Megerősítéses Tanulás esetén is, ezek közé sorolható a neurális hálózat konvergenciájának gyorsítása (betanulás gyorsítása) és pontosítása. Dolgozatom során egy másik - a témában ismeretes - algoritmust is felhasználtam, az RRT algoritmust. Az alapja az, hogy a véletlenszerűen kiválasztott pontot a már meglévő pontok közül a hozzá legközelebbihez rendeli hozzá, így iterálva a teret. Az RRT algoritmus járműmodellel való ötvözése egy izgalmas "faszerű" trajektóriát eredményez. A dolgozat célja, hogy megvizsgáljuk milyen lehetőséget nyújt, ha a tanulás által használt adatokat nem a klasszikus algoritmus alapján generáljuk, hanem egy RRT segítségével generált trajektória szolgáltatja. A program tesztelését egy saját, jól paraméterezhető pályagenerátor által generált pályákon végeztem, egy dinamikai járműmodell segítségével. Az eredményeket pedig összehasonlítottam egy azonos paraméterekkel tanított klasszikus tanuló algoritmussal, így levonva a következtetéseket a koncepció kapcsán.

szerző

  • Angyal Bálint Gergő
    Járműmérnöki
    alapképzés (BA/BSc)

konzulens

  • Kővári Bálint
    PhD hallgató, Közlekedés- és Járműirányítási Tanszék

helyezés

I. helyezett