Regisztráció és bejelentkezés

Kép alapú forgalomelemzés mély tanulás alapon

Az elmúlt években a mély tanuló rendszerek meghódították a számítógépes látás legtöbb területét. A legkorszerűbb mély neurális hálózatok olyan feladatokat is képesek elvégezni, amelyekhez korábban szükség volt az emberi beavatkozásra, például stílusátvitelre vagy járműszámlálásra.

Évente egyre több mély tanuló rendszerekről szóló tanulmány jelenik meg, az objektumdetektálás továbbra is egy erősen kutatott terület. Az objektumdetektáló mély neurális hálózatok a legtöbb pontossági méréseken felülmúltak olyan megoldásokat, amelyek a hagyományos képfeldolgozáson alapulnak.

Az UAV (pilóta nélküli légi járművek) iparága a 19. század óta nagyon aktív, az utóbbi években a kicsi és kompakt drónok egyre jobban felszerelté és hozzáférhetővé váltak. Ezeket a kis repülőgépeket okostelefonról lehet vezérelni, élő videó küldő funkcióval rendelkeznek és több mint 15 - 20 percig lebeghetnek a levegőben.

Ebben a cikkben egy autószámláló szoftver terméket mutatok be, amely mély tanulási algoritmusokon alapszik és egy DJI Spark drón biztosítja az elő képet az autós forgalomról.

Először a tanító adatbázis építésének nehézségei kerülnek bemutatásra és hogy az adatok beszerzése közösségi alapon hogyan javíthatja a mély neurális hálózatok általános pontosságát. A mély neurális hálózatok tanítási futtatásai egy kompakt, konténer alapú formában van csomagolva, így az objektum detektáló modell tanítható CPU-n, GPU-n és felhő szolgáltatók által biztosított szervereken is. A mély neurális hálózat általános pontossága mindig javul azáltal, hogy az új, friss képeken tovább tanításra kerül sor, azokon a képeken, amelyeket a közösség gyűjtött. A modell architektúrájának és tanított súlyainak létrehozása az első lépés egy mély tanulásra épülő szoftvertermék felépítésében, a predikciók futtatása egy elemeiben más terület, ahol nap mint nap új technológia megoldások jelennek meg. A predikciós futási idők az egyes hardvereken és szoftverelemeken változhatnak, ezért kiemelten fontos megérteni a stabil és kiszámítható környezet biztosításához szükséges követelményeket és elérhető megoldásokat. Több predikciós környezet kerül teljesítmény tesztelés, elemzés és kiértékelés alá annak alapján, hogy milyen eredményeket érnek el különféle típusú predikciós kérésekre (egyszeri, sorozat és kötegelt).

Az autószámláló szoftver működése során egy élő videó csatornát nyit a Spark drón egy saját Android-alkalmazás felé, amely feldolgozza a videót és megjeleníti annak tartalmát. A mobilalkalmazás képes a videó képének feldolgozására mély neurális hálózatok segítségével a mobil készülék hardverén, és az eredményeket a készülék képernyőjén megjeleníteni. Az eredményeket emellett továbbítja egy online webalkalmazáshoz, amely tovább javítja az eredményeket egyedi mély neurális hálózatokkal, és élő statisztikát mutat az aktuális autószámról és a helyzeti adatokról.

szerző

  • Gróf Attila
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Gyires-Tóth Bálint
    adjunktus, Távközlési és Médiainformatikai Tanszék