Regisztráció és bejelentkezés

Hatékony konvolúciós neurális hálózat tervezése osztályozási problémákra

Az elmúlt néhány évben a konvolúciós neurális hálózatok megreformálták a képfeldolgozás területét. Sok probléma esetén utolérték és meghaladták a klasszikus, szakértői képfeldolgozó módszerek pontosságát és hatékonyságát. Egyelőre nem mutat semmilyen jel arra, hogy a neurális paradigma ilyen jellegű, egyre szélesebb körű alkalmazásának térnyerése ne folytatódna.

Azonban ezek az új megoldások gyakorlatilag feketedoboz jellegűek még azok számára is, akik értik, hogy általánosan hogyan működnek a neurális paradigma eszközei. Bár a tanulás folyamata világos, a megtanult tudás reprezentációja nehezen interpretálható, így azon kívül, hogy meg tudjuk mérni, hogy az általunk gyűjtött, korlátos mintakészlet mekkora részére működik helyesen az adott megoldás, arra már nehezebb választ adni, hogy miért és milyen esetekben fog helytelen kimenetet előállítani. Ilyen jellegű bizonytalanságok nem engedhetőek meg biztonságkritikus rendszerek (például az önvezető autók) esetében, ahol emberi élet múlhat a rendszer hibás döntésein. Továbbá az is világossá vált, hogy nem csak a neurális paradigmán alapuló megoldások eseti hibáitól kell tartanunk, hanem lehetőség van a bemeneti képek olyan módon való manipulálására is, aminek hatására a megoldás helytelenül működik.

További probléma, hogy a state-of-the-art eredmények olyan neurális hálókon alapulnak, melyek sok, akár több száz réteggel és több millió konvolúciós szűrővel rendelkeznek. Ez a magas komplexitás a már említett interpretálhatóság problémája mellett felvet még egyéb hatékonysági problémákat is. Tipikusan százmilliós nagyságrendbeli paraméter tanulása és tárolása szükséges. Ennek következtében mind a tanítási, mind egy minta esetén a háló válaszának előállításhoz szükséges erőforrásigény is nagy. A nagyméretű és emiatt lomha hálók pedig ugyancsak hátrányt jelenthetnek bizonyos ipari felhasználásokban. Példaként itt is maradjunk az önvezető autóknál: ha a háló nem képes elég gyorsan döntést hozni, hogy kell-e fékezni adott szituációban, akkor alkalmasság megkérdőjeleződik. A hálók paraméterszámbeli és számítási erőforrásigény szerinti hatékonysága tehát kulcskérdés ma is, és várhatóan az is marad az éles, gyakorlat alkalmazások esetén a jövőben is.

Munkám során olyan neurális háló struktúrákat terveztem és vizsgáltam meg, melyekkel a fenti problémák enyhíthetőek. Például egy objektum képe változatos geometriai torzításokat követően jelenhet meg egy felvételen, mely miatt a hálók által tanult szűrések rendszerint jelentősen redundánsak. Regisztrált, vagy többé-kevésbé homogenizált bemenet előállítása után a szükséges szűrők és így a rétegek száma is csökkenthető. További egyszerűsítések mentén még átláthatóbbá tehetők a döntési folyamatok, valamint a méretcsökkenés miatt a valós idejű kivitelezhetőség is realitássá válhat. Ezen egyszerűsítések alapötleteit általában a klasszikus képfeldolgozás jól bevált módszerei adják.

szerző

  • Formanek András
    Mérnök informatikus szak, alapképzés
    alapképzés (BA/BSc)

konzulens

  • Hadházi Dániel
    tudományos segédmunkatárs, Méréstechnika és Információs Rendszerek Tanszék