Regisztráció és bejelentkezés

Valós idejű objektum felismerés gépi látás segítségével

Az utóbbi években részben a korszerű okostelefonok és tabletek tömeges elterjedése miatt egyre inkább megjelentek hétköznapjainkban olyan alkalmazások, melyek a valós életben látottakat többlet információval egészítik ki. Ennek alapja, hogy eszközünk a kameraképen felismer egy megadott objektumot, majd annak megfelelően a valóságot virtuálisan kibővíti. Például ha ránézünk egy étterem logójára (tipikusan mobilunk vagy tabletünk segítségével, vagy akár például otthon webkamera segítségével), eszközünk kiírja, hogy hogyan juthatunk el oda a leghamarabb, és akár az étlapra is vethetünk virtuálisan egy pillantást.

Munkánk célja ezen folyamat első felének taglalása, azaz hogy miként tud eszközünk bizonyos objektumokat felismerni. Ennek során az egyes módszerek elméleti hátterének ismertetésén túl kitérünk olyan gyakorlati részletekre is, mint például ezen módszereknek az OpenCV gépi látás könyvtár felhasználásával való alkalmazása, és az erőforrásigényük vizsgálata. Ez utóbbi azért is fontos szempont, mert egyik célunk az okostelefonokon kielégítő teljesítménnyel történő futás elérése több lehetséges felismerhető objektum detektálása során.

A dolgozatban három főbb objektum felismerésre alkalmas módszert vizsgálunk meg: a korrelációs mintaillesztés alapú felismerést, a kaszkádosított osztályozó alapú felismerést illetve a jellegzetesség megfeleltetés alapján való felismerést. A kaszkádosított osztályozó alapú detektor tárgyalása során külön kitérünk a Haar-szerű jellegzetességek és az LBP (Local Binary Patterns) jellegzetességek jellemzőire.

Dolgozatunk valós életből vett példák alapján bemutatja az elterjedt detektáló algoritmusok alkalmazhatóságát, mérési eredmények alapján szemlélteti azoknak korlátait, bemutatja azok Android platformon történő használatát.

Részletezi, hogyan lehet az OpenCV által biztosított eszközök segítségével kaszkádosított osztályozó alapú detektorokat készíteni, majd az általunk fejlesztett környezetben tesztelni és értékelni a kapott eredményt. Bemutatja ennek kapcsán a felismerendő objektum betanítási folyamatának elméleti és gyakorlati menetét.

Az elvégzett munkánk alapja lehet objektum felismeréshez kapcsolódó további kutatási és oktatási feladatoknak.

szerzők

  • Varga Márton Bálint
    mérnökinformatikus
    nappali
  • Tenk Milán
    villamosmérnöki
    nappali

konzulens

  • Dr. Csorba Kristóf
    egyetemi docens, Automatizálási és Alkalmazott Informatikai Tanszék