Regisztráció és bejelentkezés

Anchor-free járműdetektálás kontrasztív objektum szűrővel

A járműdetektálás már régóta a modern forgalomirányítási és -felügyeleti rendszerek fontos alapköve, amely a biztonsági intézkedéseket, a forgalom optimalizálását és az autonóm járművek irányítását segíti. A valós idejű analitikára való egyre nagyobb támaszkodás és az edge eszközök jelentős térnyerése miatt a járművek gyors és pontos észlelése a legkülönfélébb helyzetekben kiemelkedő fontosságúvá válik. A hagyományos képfeldolgozási módszereket félrevezethetik a környezet dinamikus változásai, a járművek különböző megjelenési formái, valamint a tájolás vagy a méretarányok eltérései, így valós környezetben nem megbízhatóak. A mélytanulás, mivel képes tanulni és általánosítani számtalan helyzetben, megoldásként szolgálhat ezekre a kihívásokra. A legtöbb mélytanulás-alapú detektor azonban anchor-boxokra - előre meghatározott térbeli szűrőkre - támaszkodik, amelyek korlátozhatják alkalmazkodóképességüket és sebességüket. Emellett időkritikus és helyszíni rendszerekben gyakran nincs lehetőség a kiterjedt számítási erőforrásokra, kevésbé toleránsak a késleltetésre.

Ezen nehézségeknek a megoldására a dolgozatom elsősorban az anchor-free detektálás világában merül el, mely egy olyan paradigma, amely megkerüli az előredefiniáltság miatt keletkezett korlátokat, rugalmasabb és potenciálisan gyorsabb detektálást tesz lehetővé. Az anchor-free architektúrák számos benchmark-on state-of-the-art teljesítményt érték el mean Average Precision (mAP) tekintetében. Ezek a módszerek azonban jellemzően többfejes architektúrát alkalmaznak, ami a paraméterek számának jelentős növekedését eredményezi. Következésképpen kihívást jelent alacsony késleltetésű környezetben való alkalmazásuk.

A dolgozatban kidolgoztam egy egy-fejes, alacsony paraméter számú, anchor-free architektúrát, amely lehetővé teszi a szigorú időkorlátokkal és korlátozott erőforrásokkal rendelkező rendszerekben való alkalmazását. Ezt az architektúrát egy példánykódolási technika egészíti ki, melyben egy asszociatív embedding réteg és a kontrasztív tanulás kombinálásával a modell képes megkülönböztetni és elvetni az azonos objektumot detektáló, egymást átfedő dobozokat. Ez a technika felfogható úgy, mint egy tanulható, Non-Maxima Supression (NMS) mechanizmus.

Az implementált eljárás teljesítményét a népszerű járműdetektálásra használt KITTI adathalmazon értékeltem ki. Az eredményeket részletekbe menően összevetettem a korábbi megoldásokkal sebesség és pontosság tekintetében, hogy teljes képet alkothassak az új eljárás teljesítményéről.

szerző

  • Tárnok Márton
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Szemenyei Márton
    Adjunktus, Irányítástechnika és Informatika Tanszék

helyezés

I. helyezett