Regisztráció és bejelentkezés

Folyami mederanyag szemösszetételének vizsgálata Deep Learning eljárással drónfelvételek alapján

Az elmúlt években a számítógépes látás és mintafelismerés hatalmas fejlődésen ment keresztül, amely egyrészt köszönhető a jelentősen megnövekedett számítási teljesítménynek, továbbá az alkalmazott algoritmusok és metódusok kifinomultabbá válásának. Jelenleg a mély neurális hálózatok produkálják a legjobb eredményeket ezeken a területeken. Ebben a kutatásban azt szeretném megvizsgálni, hogy a 2012 óta [Krizhevsky et al. 2012] a figyelem középpontjában lévő Deep Learning eljárással, felgyorsítható és végső esetben automatizálható-e a szemeloszlási vizsgálatok kivitelezése. A kutatás keretében egy ellenőrzött tanulást hajtok végre, ahol a Duna felső-magyarországi szakaszán készült partmenti drónfelvételekből készített adathalmazzal tanítom a modellt szemeloszlási osztályok felismerésére. A morfodinamikai vizsgálatok során napjainkban alkalmazható eljárásokkal csupán pontbeli szemösszetételi adatok nyerhetők, költséges és időigényes terepi mérések és laboratóriumi elemzések által. A Deep Learning alkalmazásától azt várom, hogy drónokról készített képsorozatokon keresztül a mederanyag szemösszetételéről területi eloszlásokat lehet előállítani. A módszerben rejlő másik jelentős potenciál, hogy megfelelő tanítás után, a képelemzés ideje rendkívül lecsökken, így nagy kiterjedésű területekre lehet rövid idő alatt mederanyag térképeket produkálni. A jelenleg alkalmazható eljárásokhoz képest ez a módszer jelentős fejlődést jelentene folyamok partmenti sávjának morfodinamikai vizsgálataiban.

Az architektúra, melyet használok a Google kutatói által lett kifejlesztve, és a Deeplab nevet viseli. A modell 2018 márciusában lett publikálva, és jelenleg az egyik legjobb szemantikus szegmentálást végző architektúra a világon, amelyben implementálva vannak az előző évek legfontosabb kutatási eredményei. A szemantikus szegmentálás lényege, hogy a programnak inputként beadott kép minden egyes pixeljéhez egy osztályt kell rendelnie, ezáltal klasszifikálva a teljes kép tartalmát. Ebben a kutatásban a szemösszetételi osztályokat szegmentálom. A szegmentálás eredményeként kapott képekből utólagos algoritmusok lefuttatásával szemeloszlási görbéket kaphatunk.

A vizsgálat során nagy felbontású drónfelvételeket használok, amelyeket később a kedvezőbb számítási teljesítmény miatt kisebb felbontásúvá alakítok. A Deeplab modell és a hozzá kapcsolódó képmanipuláló, összesítő és plottoló algoritmusok Python nyelven kerülnek implementálásra. A modell maga a Tensorflow keretrendszert használja, amelynek lényege, hogy a tanulás és osztályozás során az adatok tenzorokként haladnak át a számítási gráfon. [Dean et al. 2015].

A kutatás fő célja annak értékelése, hogy a jelenlegi, képfelismerésre kialakított konvolúciós neurális hálózatok alkalmasak-e a folyamok mederanyagát alkotó frakciók felismerésére és osztályozására.

Irodalom:

1. Krizhevsky et al.: ImageNet Classification with Deep Convolutional Neural Networks, University of Toronto, 2012

2. Dean et al.: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems, Google Research, 2015

3. Chen et al.: DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs, IEEE, 2017

4. Horváth G. et al.: Neurális hálózatok, Panem Könyvkiadó, 2006

szerző

  • Benkő Gergely
    Építőmérnöki szak (műszaki alapdiploma BSc szint)
    alapképzés (BA/BSc)

konzulensek

  • Dr. Baranya Sándor
    egyetemi docens, Vízépítési és Vízgazdálkodási Tanszék
  • Dr. Török Gergely Tihamér
    tudományos segédmunkatárs, Vízépítési és Vízgazdálkodási Tanszék
  • Dr. Molnár Bence
    egyetemi docens, Fotogrammetria és Térinformatika Tanszék

helyezés

Egyetemi Hallgatói Képviselet I. helyezett