Multi-ágens Megerősítéses Tanulás alapú döntéshozás autópályás környezetben

A növekvő járműforgalom hatására a telítődő utakon kialakuló tranziensek nagy mértékű kumulatív hibát eredményeznek, ezzel a járműcsoportok mozgásának folytonosságában visszaesést indukálva. Autópályás környezetben ez a jelenség halmozottan hátrányos helyzeteket szül a nagy sebességek miatt, ezért a feloldás érdekében lokális sebességkorlátozások bevezetése szükségszerű, amivel az adott forgalmi szegmens be- és kilépő járműveinek különbségével lehet jobban terhelni vagy üríteni egy érintett zónát. A rendelkezésre álló infrastruktúra kihasználtságának növelése érdekében számos járműirányítási megközelítés létezik, ami dinamikus sebességkorlátozáson alapul, ezzel térben elosztva az áramló járműveket és csökkentve a torlódás mértékét. Ezeknek a beavatkozási formáknak nagy része elágazásokon alapuló algoritmus, melyek küszöbértékeket átlépve a kialakult mozgó forgalmi hullámok identifikációját követően aktiválnak egyes állapotokat, ezzel feloldva a már kialakult anomáliákat.

A dolgozatban ezekkel az állapotgépet megvalósító implementációkkal szemben egy Multi-Ágens Megerősítéses Tanuláson alapuló realizáció kerül bemutatásra, ami a Gépi Tanulás fő irányai közül a legkisebb ipari részesedéssel bír, ennek ellenére számos tulajdonsága mégis a korszerű és ígéretes kutatási területek közé emeli. Mély Tanulással ötvözve a Megerősítéses Tanulás célja, hogy a modell identifikációt és a fizikai egyenletek megfogalmazását elkerülve olyan prediktív irányítási struktúrát hozzunk létre, ami nem csupán feloldja, de meg is előzi a shock wave kialakulását.

szerző

Knáb István Gellért
Járműmérnöki
alapképzés (BA/BSc)

konzulens

Kővári Bálint
PhD hallgató, Közlekedés- és Járműirányítási Tanszék

helyezés

I. helyezett