Folyami mederanyag szemösszetételének vizsgálata Deep Learning eljárással drónfelvételek alapján

Az elmúlt években a számítógépes látás és mintafelismerés hatalmas fejlődésen ment keresztül, amely egyrészt köszönhető a jelentősen megnövekedett számítási teljesítménynek, továbbá az alkalmazott algoritmusok és metódusok kifinomultabbá válásának. Jelenleg a mély neurális hálózatok produkálják a legjobb eredményeket ezeken a területeken. Ebben a kutatásban azt szeretném megvizsgálni, hogy a 2012 óta [Krizhevsky et al. 2012] a figyelem középpontjában lévő Deep Learning eljárással, felgyorsítható és végső esetben automatizálható-e a szemeloszlási vizsgálatok kivitelezése. A kutatás keretében egy ellenőrzött tanulást hajtok végre, ahol a Duna felső-magyarországi szakaszán készült partmenti drónfelvételekből készített adathalmazzal tanítom a modellt szemeloszlási osztályok felismerésére. A morfodinamikai vizsgálatok során napjainkban alkalmazható eljárásokkal csupán pontbeli szemösszetételi adatok nyerhetők, költséges és időigényes terepi mérések és laboratóriumi elemzések által. A Deep Learning alkalmazásától azt várom, hogy drónokról készített képsorozatokon keresztül a mederanyag szemösszetételéről területi eloszlásokat lehet előállítani. A módszerben rejlő másik jelentős potenciál, hogy megfelelő tanítás után, a képelemzés ideje rendkívül lecsökken, így nagy kiterjedésű területekre lehet rövid idő alatt mederanyag térképeket produkálni. A jelenleg alkalmazható eljárásokhoz képest ez a módszer jelentős fejlődést jelentene folyamok partmenti sávjának morfodinamikai vizsgálataiban.

Az architektúra, melyet használok a Google kutatói által lett kifejlesztve, és a Deeplab nevet viseli. A modell 2018 márciusában lett publikálva, és jelenleg az egyik legjobb szemantikus szegmentálást végző architektúra a világon, amelyben implementálva vannak az előző évek legfontosabb kutatási eredményei. A szemantikus szegmentálás lényege, hogy a programnak inputként beadott kép minden egyes pixeljéhez egy osztályt kell rendelnie, ezáltal klasszifikálva a teljes kép tartalmát. Ebben a kutatásban a szemösszetételi osztályokat szegmentálom. A szegmentálás eredményeként kapott képekből utólagos algoritmusok lefuttatásával szemeloszlási görbéket kaphatunk.

A vizsgálat során nagy felbontású drónfelvételeket használok, amelyeket később a kedvezőbb számítási teljesítmény miatt kisebb felbontásúvá alakítok. A Deeplab modell és a hozzá kapcsolódó képmanipuláló, összesítő és plottoló algoritmusok Python nyelven kerülnek implementálásra. A modell maga a Tensorflow keretrendszert használja, amelynek lényege, hogy a tanulás és osztályozás során az adatok tenzorokként haladnak át a számítási gráfon. [Dean et al. 2015].

A kutatás fő célja annak értékelése, hogy a jelenlegi, képfelismerésre kialakított konvolúciós neurális hálózatok alkalmasak-e a folyamok mederanyagát alkotó frakciók felismerésére és osztályozására.

Irodalom:

1. Krizhevsky et al.: ImageNet Classification with Deep Convolutional Neural Networks, University of Toronto, 2012

2. Dean et al.: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems, Google Research, 2015

3. Chen et al.: DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs, IEEE, 2017

4. Horváth G. et al.: Neurális hálózatok, Panem Könyvkiadó, 2006

szerző

Benkő Gergely
Építőmérnöki szak (műszaki alapdiploma BSc szint)
alapképzés (BA/BSc)

konzulensek

Dr. Baranya Sándor
egyetemi docens, Vízépítési és Vízgazdálkodási Tanszék
Dr. Török Gergely Tihamér
tudományos munkatárs, Vízépítési és Vízgazdálkodási Tanszék
Dr. Molnár Bence
egyetemi docens, Fotogrammetria és Térinformatika Tanszék

helyezés

Egyetemi Hallgatói Képviselet I. helyezett