Regisztráció és bejelentkezés

Kamerafelvétel alapú távolságbecslés mély neurális hálóval

Az elmúlt évek egyik legnagyobb szoftvermérnöki kihívása egy olyan önvezető rendszer megalkotása, amely képes bármely közlekedési szituációban önállóan helyes döntést hozni (ötös szintú autonómia). A technológia jelen állása lehetővé teszi a részben önvezető rendszerek meglétét a már utcán közlekedő autókban (kettes szintű autonómia). Jelenleg úgy tűnik, hogy az önvezetéshez használatos szenzorok képességei és a feldolgozáshoz szükséges nagy számítási igény lehetővé tennék egy ötös szintnek megfelelő önvezető rendszer megalkotását, de a probléma bonyolultságából kifolyóan nem lehet klasszikus algoritmusokkal elvégezni ezt a feladatot.

Az utóbbi évtizedben sokat fejlődött a machine learning terület deep learning iránya, amely lehetővé teszi olyan kép és egyéb szenzoradatok feldolgozását, ami nagyban elősegítheti egy magasabb szintű önvezető rendszer létrejöttét.

A különböző szenzoradatok feldolgozásáért egy mély neurális háló a felelős, amely több, különböző részfeladatot old meg egyszerre (multitask learning). Ilyen részfeladatok az objektumdetekció, a sávok észlelése, vagy éppen a kereszteződés helyének és a közlekedési lámpa állapotának megállapítása. Egyes részfeladatok együttes tanítása hatékonyabb lehet és jobb teljesítményt produkálhat, mintha ezeket a feladatokat külön-külön neurális hálóval oldottuk volna meg.

Dolgozatomban egy bizonyos részfeladat, a távolságbecslés problémakörét és annak megvalósítását vizsgálom, mégpedig kizárólag kameraszenzorok segítségével. Célom egy olyan neurális háló tanítása volt, amely képes a képen látható egyes pixelekhez távolságértékeket rendelni. Továbbá előállok egy saját ötleten alapuló hibafüggvénnyel, mégpedig a távolságértékek hibájának számításakor figyelembe veszem a rendelkezésre álló szemantikus szegmentációt is. Ennek célja, hogy egyes objektumok, mint például az autók és gyalogosok, amik a kép csupán egy kis részét alkotják, nagyobb súllyal szerepeljenek a hibaszámításba, így ellensúlyozva az aránylag kis méretüket.

szerző

  • Füleki Fábián
    Mérnök informatikus szak, alapképzés
    alapképzés (BA/BSc)

konzulensek

  • Dr. Gyires-Tóth Bálint
    adjunktus, Távközlési és Médiainformatikai Tanszék
  • Kabai Róbert Zsolt
    Deep Learning for Point Cloud Team Lead, Continental (külső)