Tér rekonstrukciója egyetlen kamera alkalmazásával
A háromdimenziós világunk rekonstrukciója a virtuális térben nagyon fontos kérdés napjainkban. Az önvezető autók, robotok, drónok esetében rendkívül fontos, hogy el tudják helyezni önmagukat a térben, ami kritikus a navigációjuk megvalósításához. Szintén kulcskérdése ez a kiterjesztett és vegyes valóság rendszereknek, hiszen ott is ismernie kell a programnak az eszköz környezetét. Ezekre jelenleg a legtöbb megoldás több kamerát, LIDAR-t, vagy pedig ToF kamerákat használ, amelyek költséges és bonyolult megoldások, főleg egyetlen kamera használatához viszonyítva. Továbbá, ezek speciális hardvert igényelnek, míg a legtöbb okos eszköz napjainkban rendelkezik kamerával. Egyetlen kamera egyetlen képe természetesen nem elégséges a 3D környezet meghatározására, viszont összefüggő képsorozatok esetében lehetséges a képrészletek mozgása alapján azok térbeli elhelyezkedésére, valamint a kamera aktuális pozíciójára következtetni.
A dolgozatom célja egy egykamerás módszer implementálása és összehasonlítása egy ToF kamera felvételeivel. Ehhez az LSD-SLAM (Large-Scale Direct Monocular Simultaneous Localization and Mapping) keretrendszert választottam, ami egy kamerafelvétel sorozat alapján rekonstruálja a képeken szereplő objektumokat.
Az ezzel létrehozott háromdimenziós rekonstrukcióját a térnek hasonlítom össze a ToF kamera mélység felvételeivel a megfelelő kamera pozíciókban. Az összehasonlítással megállapítva az egykamerás rekonstrukció megbízhatóságát különféle képtartalom és környezetek esetében: azaz a képkészítési/mintavételezési sűrűség, valamint a részletgazdagság miképp befolyásolja az elérhető pontosságot.
szerző
-
Ghimessy Balázs Artúr
Mechatronikai mérnöki alapszak (BSc)
alapképzés (BA/BSc)
konzulensek
-
Pizág Bertalan
tanársegéd, Mechatronika, Optika és Gépészeti Informatika Tanszék -
Kovács Szilárd
Doktorandusz, Mechatronika, Optika és Gépészeti Informatika Tanszék