Regisztráció és bejelentkezés

Emberi és számítógépes mozgásfelismerés összefüggéseinek vizsgálata

Az emberi érzékelés egyik alappillére a látás. Vizuális információ segítségével vagyunk képesek saját, de főleg környezetünk mozgásának felismerésére. Pusztán vizuális információból a mozgások felismerése nem triviális. Egy nemrég elvégzett humán kutatásban (Masoner, 2022) a kísérleti alanyoknak egy testre rögzített kamera által készített videófelvételeket kellett megtekinteni. A kutatók bebizonyították, hogy pusztán a kameramozgás (a mozgó test látványa nélkül) is elegendő információt szolgáltatott a testmozgás felismeréséhez. A kutatásból nem derült ki, hogy milyen fajta vizuális mintázat szolgáltatja az információt. Gibson (1979) hipotézise szerint a mozgásfelismerés alapja az optic flow, ami a vizuális ingert létrehozó fényviszonyok időbeli változását térképezi fel a látható tér minden egyes pontjában.

A jelenlegi kutatás célja az említett humán kísérleti munka eredményeinek (es Gibson hipotézisének) igazolása az ott felhasznált videók számítógépes elemzésével. A videókban a képpontok intenzitásának a változását számítottuk ki képkockák között, ami gyakorlatilag a kamera környezethez viszonyított sebességét mutatja. A kapott sebesség-idő függvényekkel definiáltuk a mozgásokat, illetve vizsgáltuk a videóban szereplő mozdulatok hasonlóságát, egymással való korrelációját. Az összehasonlítás alapjául az intenzitás függvények korrelációját vettük, illetve az ún. dynamic time warping (DTW) paramétert számoltuk ki.

A kapott eredmények alátámasztják a korábbi kutatás eredményeit: a függvények korrelációjának mértéke összefügg a humán kísérletben résztvevők által elért eredménnyel: minél jobban hasonlít két mozgás függvénye annál kevesebben tudták megkülönböztetni a mozgásról készült egocentrikus videókat. A videóelemzés eredményei egyrészt hozzájárulnak a humán észlelés alapkutatásához a mozgásfelismerés alapjául szolgáló vizuális információ feltérképezése által, másrészt pedig a gépi látás rendszerek precizitását is növelik, ami alkalmazható a rendőrök által viselt testre rögzített kamera felvételek automatikus elemzéséhez.

szerzők

  • Fabrinczius Zorán György
    Mechatronikai mérnöki alapszak (BSc)
    alapképzés (BA/BSc)
  • Hunyady Botond
    Mechatronikai mérnöki alapszak (BSc)
    alapképzés (BA/BSc)
  • Görcs András
    Mechatronikai mérnöki alapszak (BSc)
    alapképzés (BA/BSc)
  • Szabó András
    Mechatronikai mérnöki alapszak (BSc)
    alapképzés (BA/BSc)

konzulensek

  • Dr. Samu Krisztián
    egyetemi docens, Mechatronika, Optika és Gépészeti Informatika Tanszék
  • Dr. Hajnal Alen
    egyetemi docens, University of Southern Mississippi (külső)

helyezés

II. helyezett