Regisztráció és bejelentkezés

Gépi tanulás alapú anomáliadetekció előfeldolgozott és részekre bontott adatsorokon

Napjainkban a hálózati eszközök, rendszerek és szolgáltatások folyamatos felügyelete lényegesebb, mint valaha. Ennek számos haszna lehet, mint például üzemzavar előrejelzése; leállások elkerülése; rendszerek teljesítményének monitorozása; továbbá rendszerek biztonságának felügyelete és esetleges támadások észlelése.

A begyűjtött adatok feldolgozásának egyik legígéretesebb módja a hibás működésre utaló jelek pontos azonosítása, illetve sürgős jelentése, azaz az anomáliadetekció. Ez a dolgozat kifejezetten erre a feladatra összpontosít, és új megvilágításba kívánja helyezni az idősor alapú telemetria adatokon való anomáliadetekciót. Erre a célra egyre többen gépi tanuló algoritmusokat alkalmaznak, melyek képesek megérteni, csoportosítani és értékelni az infrastruktúra elemeinek működését leíró információkat, még számottevő adathalmazok esetén is. Azonban így is számos feladat vár megoldásra a problémával kapcsolatban, mint például nagyméretű adatok hatékony előfeldolgozása.

A korszerű, idősorokon végzett anomáliadetekciót megvalósító eljárások irodalomkutatása során az ún. Long-Short Term Memory alapú, ReRe elnevezésű, Ming-Chang Lee és társai által kidolgozott algoritmust azonosítottuk, mint jelenleg az irodalomban elérhető egyik leghatékonyabb eljárás hálózati telemetria adatokra. Korábbi munkáink során kidolgoztuk a ReRe algoritmus továbbfejlesztett és hatékonyabb változatát, az Alter-Re² algoritmust, mely képes ritka modelltanítással is magas pontosságot és kevés téves pozitív jelzést elérni. Az eljárással kapcsolatban azonban továbbra is azonosíthatunk néhány hiányosságot. Kiemelendő ezek közül, hogy periodikus adatsorokra nem alkalmazható, így a jelen munka során célunk ezen problémának kiküszöbölése volt különböző előfeldolgozó, illetve adattranszformációs eljárások segítségével.

Kutatásunk kiindulópontjaként a Konstantin Dragomiretskiy és tsa. által kifejlesztett Variational Mode Decomposition (VMD) elnevezésű eljárást választottuk, mely egy modern, matematikailag mélyen megalapozott adatdekompozíciós módszer. A VMD az eredeti adatsort kis sávszélességű függvényekre (módusokra) bontja szét, melyek összege jól közelíti az eredeti adatokat. Feltevésünk szerint ezen módusok közül néhányat, illetve akár az összeset kivonva az eredeti jelből olyan eredő adatsort kapunk, melyből az idősor periodikus jellegét eltávolítottuk, amely azonban továbbra is magán hordozza az anomáliák jellemző jegyeit.

Ennek ellenőrzésére részletes és mélyreható kísérleteket végeztünk, melyben az eredeti idősort először különböző előfeldolgozó eljárásokkal (mint például skálázás) átalakítottuk, ezt követően a VMD algoritmussal a fent részletezett módon transzformáltuk, végül pedig az így kapott adatokon lefuttattuk Alter-Re² eljárásunkat. Kísérleteink eredményeit, illetve tudományos kutatásunkat a dolgozatban fejtjük ki.

szerző

  • Vajda Dániel László
    Villamosmérnöki szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Farkas Károly
    Egyetemi docens, Hálózati Rendszerek és Szolgáltatások Tanszék

helyezés

Huawei Technologies Hungary Kft. I. helyezett