Regisztráció és bejelentkezés

Kisméretű légi járművek navigációja városi környezetben mélytanulási eljárások segítségével

Napjainkban egyre több helyen alkalmaznak kisméretű légijárműveket (MAV, Micro Aerial Vehicle) az élet minden területén. Használják a mezőgazdaságban, a filmiparban, vagy akár kisebb méretű csomagok szállítására. Ezeket a drónokat nagyrészt emberek irányítják, azonban a legújabb alkalmazások megkövetelik a drónok megbízható önálló működését. Ilyen feladat például a drónok városi környezetben való alkalmazása. A városi utak túlterheltsége miatt kézenfekvő a csomagok légi fuvarozása. Azonban míg egy drón könnyen navigál a házak felett GPS alapján, addig a házak között a GPS jelek leárnyékoltsága, illetve az akadályok közelsége miatt más megközelítésre van szükség. Erre megoldás lehet egy, a járműre rögzített kamera alkalmazása, mellyel információt nyerhet a robot a környezetéről.

Szimultán helymeghatározás és térképezésnek, röviden SLAM-nek (Simultaneous Localization and Mapping) nevezzük azt a problémakört, amikor a robotnak egyszerre kell feltérképeznie a környezetét, és meghatároznia a saját helyzetét ezen a térképen. Minél gazdagabb ez a térkép, és minél magasabb a szemantikai információtartalma, annál hasznosabb az autonóm robot feladatainak ellátása céljából.

A dolgozatom célja olyan mélytanuláson alapuló képfeldolgozási módszer alkalmazásának bemutatása autonóm mobil robotok esetén, amely lehetővé teszi a robotok számára a környezetük magasszintű megértését, és ezáltal segítve a tájékozódásukat. A mély konvolúciós neurális hálók (DCNN) térnyerésével olyan, eddig elképzelhetetlen feladatok megoldása is elérhetővé vált, mint a kép-klasszifikáció, objektum detekció, vagy a szemantikai szegmentáció. Ezek az eljárások lehetővé teszik a robotok robosztus navigációját.

Munkám során kiterjedt irodalomkutatást végeztem gépi tanulás és robotok lokalizációja területén, emellett szabadon hozzáférhető kép adathalmazok, illetve programkódok keresésére is figyelmet fordítottam, amelyeket a későbbiekben használtam. A neurális háló tanítására az ADE20K nevű adathalmazt választottam. Ez egy olyan képgyűjtemény, amely a legkülönfélébb helyszíneken készült képeket tartalmaz, a hozzájuk tartozó annotált maszkokkal. Ezeket a képeket először szelektálnom kellett, azokra a képekre, amelyek olyan elemeket tartalmaznak, amelyek városi környezetben is előfordulnak, illetve olyan formába hoznom, hogy azt a neurális háló tanítására alkalmazni tudjam. Ezt követően elvégeztem egy ResNet háló tanítását, amely képek szemantikai szegmentálására alkalmas, majd az eredményeket a Zürich MAV adathalmazon teszteltem. Ez az adathalmaz kifejezetten drónok városi navigációs algoritmusainak tesztelésére készült. Az eredményeket felhasználva vizsgáltam a szemantikai információ felhasználásának lehetőségeit a SLAM problémakörben.

csatolmány

szerző

  • Berta Benjamin
    Mechatronikai mérnöki alapszak (BSc)
    alapképzés (BA/BSc)

konzulensek

  • Dr. Majdik András László
    tudományos munkatárs, MTA SZTAKI (külső)
  • Dr. Szirányi Tamás
    egyetemi tanár, Anyagmozgatási és Logisztikai Rendszerek Tanszék