Ipari adathalmazok hatékony annotálása mesterséges intelligencián alapuló módszerekkel

Manapság a mesterséges intelligencia fejlődésével és terjedésével egyre szélesebb körben alkalmazzák ipari környezetben is, azonban az általa jelentett előnyökhöz gyakran problémák is társulnak. Egyik ilyen jelentkező nehézség a tanításhoz szükséges adathalmaz összeállítása, amely lényegében minták címkézését jelenti. Ezt sok esetben a nagyobb cégek emberi erővel viszonylag könnyedén el tudják végezni, azonban kisebb projektek, fejlesztések esetében nincs erre megfelelő erőforrás, célszerűnek adódik tehát ebben az esetben is a mesterséges intelligenciát, azon belül is a mélytanulást alkalmazni. Ebből kiindulva a dolgozatban bemutatásra kerül 2, a látens téren alapuló mintakiválasztási módszer, amelyek a kiértékelések alapján akár mindössze pár 100 adat annotálásával képesek megfelelő klasszifikációs képességet elérni. Ezen kívül az eredmények értelmezésének segítésére a javasolt módszerek összehasonlításra kerülnek egy, az alapszintet képviselő naiv eljárással. Maga a kiértékelés több metrika alapján, 3 különböző adathalmazon történik, melyek közül az egyik ipari adathalmaz, míg a másik 2 mesterségesen előállított úgy, hogy a valóságos eseteket közelítsék. Ezen kívül a módszerekhez szükséges látens tér szerkezetét 2 különböző modellarchitektúra alapján állítjuk elő, így végeredményben 12 összeállítást megvizsgálva. Az így definiált kísérleteket, modelleket többször feltanítva és kiértékelve egy átfogó képet kapunk arról, hogy az egyes felvázolt módszerek és eljárások milyen hatékonysággal és megbízhatósággal rendelkeznek a különböző összetettségű adathalmazok esetén, illetve milyen előnyökkel és esetlegesen előforduló hátrányokkal bírnak.

szerző

Szécsényi Nándor
Villamosmérnöki szak, mesterképzés
mesterképzés (MA/MSc)

konzulens

Dr. Lengyel László
egyetemi docens, Automatizálási és Alkalmazott Informatikai Tanszék

helyezés

Morgan Stanley III. helyezett

letöltés
5 080 kB