Kártékony növények azonosítása közösségi adatbázisból mély konvolúciós hálózatokkal

Jelen dolgozat egy napjainkban egyre fontosabbá váló témát, a kártékony növények automatikus felismerését taglalja. Kártékonynak nevezzük azokat a növényeket, melyek nem őshonosok, nincs természetes ellenségük, így kipusztítják az őshonos növényeket, továbbá pollenjeik tömegesen válthatnak ki akár különösen súlyos allergiás reakciókat. Hazánkban talán a leginkább ismert ilyen növény a parlagfű. E növények mielőbbi azonosítása és irtása kiemelten fontos.

Ma már több olyan okostelefon alkalmazás is van (pl. iNaturalist, Tela Botanica), melyek segítségével bárki tölthet fel képeket a környezetében található növényzetről, külön megjelölve, hogy az kártékony-e. Ennek a közösségi (“crowdsourced”) adatgyűjtésnek köszönhetően jelentős méretű kép adatbázis áll rendelkezésre kártékony növényekről. Viszont egyben hatalmas kihívás is egy ilyen közösségi kép adatbázissal dolgozni, hiszen nem előre meghatározott szempontok alapján, profi fotósok állítják be a képeket, hanem hétköznapi emberek eltérő irányokból és szögekből, eltérő készülékekkel különböző minőségű képeket készítenek. Sőt, akár egy képen több növényrészlet is előfordulhat, ezzel tovább nehezítve a felismerést.

Kutatási témám ötletét a LifeCLEF 2016-os verseny, azon belül a PlantCLEF 2016-os versenykiírás adta. A versenyben megfogalmazott feladat célja az volt, hogy 113205 darab, 1000 osztályba sorolt, az előbb említett “crowdsourced” adatbázisból származó tanító adatra támaszkodva további 8000 tesztképet kellett minél nagyobb pontossággal a tanító adatokból megtanult osztályokba sorolni.

Az elmúlt évtizedben a gépi képfelismerésnek és képosztályozásnak egyik meghatározó technikájává váltak a mély konvolúciós neuronhálók. A grafikus processzorok (Graphical Processing Unit, GPU) ugrásszerű fejlődése, az egyre növekvő mennyiségű adat és az új tudományos eredmények lehetővé tették, hogy napjainkra a konvolúciós neurális hálózatok akár még az embernél is jobb eredményeket érjenek el a képek felismerésében.

A kutatásom is a mély neurális hálózatokon alapul. Dolgozatomban megvizsgálom a különböző képfelismerő architektúrák elméleti hátterét és kiválasztom az általam a célnak legmegfelelőbbnek ítélt módszereket. A kutatás során 3 különböző típusú, a nemzetközi szakirodalom szerint nagy pontosságú és széles körben használt konvolúciós neurális hálózatot használok. A neuron hálókat vagy az alapoktól kezdve tanítom, vagy pedig más képekkel előretanított modelleket használok, és ezeket tanítom tovább új osztályozó rétegekkel. A tanítást két eltérő teljesítményű GPU-ra optimalizálom.

Az eredményeket mindegyik konvolúciós hálózat esetén két különböző metrikával értékelem ki: pontosság (accuracy) és MAP (Mean Average Precision). Eddigi munkám eredményeként mintegy 70%-os pontossággal meg tudom állapítani, hogy kártékony növény van-e a tesztadatbázis képein.

A PlantCLEF 2016 versenyre készített rendszer angol nyelvű konferencia cikkben került ismertetésre, mely után tovább folytattam a kutatást, az eredményeket jelen dolgozatomban mutatom be.

szerző

Osváth Márton
Villamosmérnöki szak, alapképzés
alapképzés (BA/BSc)

konzulens

Dr. Gyires-Tóth Bálint
adjunktus, Távközlési és Médiainformatikai Tanszék

helyezés

Neumann János Számítógép-tudományi Társaság I. helyezett

letöltés
1 701 kB