Emberi és számítógépes mozgásfelismerés összefüggéseinek vizsgálata
Az emberi érzékelés egyik alappillére a látás. Vizuális információ segítségével vagyunk képesek saját, de főleg környezetünk mozgásának felismerésére. Pusztán vizuális információból a mozgások felismerése nem triviális. Egy nemrég elvégzett humán kutatásban (Masoner, 2022) a kísérleti alanyoknak egy testre rögzített kamera által készített videófelvételeket kellett megtekinteni. A kutatók bebizonyították, hogy pusztán a kameramozgás (a mozgó test látványa nélkül) is elegendő információt szolgáltatott a testmozgás felismeréséhez. A kutatásból nem derült ki, hogy milyen fajta vizuális mintázat szolgáltatja az információt. Gibson (1979) hipotézise szerint a mozgásfelismerés alapja az optic flow, ami a vizuális ingert létrehozó fényviszonyok időbeli változását térképezi fel a látható tér minden egyes pontjában.
A jelenlegi kutatás célja az említett humán kísérleti munka eredményeinek (es Gibson hipotézisének) igazolása az ott felhasznált videók számítógépes elemzésével. A videókban a képpontok intenzitásának a változását számítottuk ki képkockák között, ami gyakorlatilag a kamera környezethez viszonyított sebességét mutatja. A kapott sebesség-idő függvényekkel definiáltuk a mozgásokat, illetve vizsgáltuk a videóban szereplő mozdulatok hasonlóságát, egymással való korrelációját. Az összehasonlítás alapjául az intenzitás függvények korrelációját vettük, illetve az ún. dynamic time warping (DTW) paramétert számoltuk ki.
A kapott eredmények alátámasztják a korábbi kutatás eredményeit: a függvények korrelációjának mértéke összefügg a humán kísérletben résztvevők által elért eredménnyel: minél jobban hasonlít két mozgás függvénye annál kevesebben tudták megkülönböztetni a mozgásról készült egocentrikus videókat. A videóelemzés eredményei egyrészt hozzájárulnak a humán észlelés alapkutatásához a mozgásfelismerés alapjául szolgáló vizuális információ feltérképezése által, másrészt pedig a gépi látás rendszerek precizitását is növelik, ami alkalmazható a rendőrök által viselt testre rögzített kamera felvételek automatikus elemzéséhez.
szerzők
-
Fabrinczius Zorán György
Mechatronikai mérnöki alapszak (BSc)
alapképzés (BA/BSc) -
Hunyady Botond
Mechatronikai mérnöki alapszak (BSc)
alapképzés (BA/BSc) -
Görcs András
Mechatronikai mérnöki alapszak (BSc)
alapképzés (BA/BSc) -
Szabó András
Mechatronikai mérnöki alapszak (BSc)
alapképzés (BA/BSc)
konzulensek
-
Dr. Samu Krisztián
egyetemi docens, Mechatronika, Optika és Gépészeti Informatika Tanszék -
Dr. Hajnal Alen
egyetemi docens, University of Southern Mississippi (külső)