Regisztráció és bejelentkezés

Intelligens adatfeldolgozás és -elemzés modell alapú támogatása

Informatikai rendszerekből származó adatok elemzésének egyik fontos lépése az ún. feltáró adatelemzés, mely megalapozza a későbbi statisztikai jellegű vizsgálatokat. A feltáró adatelemzés során az adattisztítás és az elemzés eredményességének feltétele annak a szakterületnek az ismerete, amelyből a vizsgált adathalmaz származik, annak érdekében, hogy a megfigyelt jelenségeket helyesen értelmezzük, ill. hatékonyan tudjuk kezelni az adatokat. Ugyanakkor az adatelemző és az adott adatforrás terület szakértője különbözhet. Jogosan merül fel a kérdés, hogy hogyan tudjuk az adatelemző és a szakértő tudását egy helyen, együttesen alkalmazni, elősegítve ezzel az adattisztítás nehézkes műveletének egyszerűsítését, gyorsítását és magának az adatelemzésnek a sikerességét.

Magas szintű szakterületi modellezés egy lehetséges módja ontológiák használata, melyek egyben lehetővé teszik a modellek formális ellenőrzését is. Munkám során arra keresem a választ, hogy egy adott szakterület tudást (pl. metrikák várható korrelációja, topológia kapcsolatok) ontológiában rögzítve és ezt a tudást összekötve a szakterületből származó adathalmazzal, hogyan lehetséges a fentebb említett adattisztítás egyszerűsítése és az adatelemzés során megállapított új tudás felvétele a már létező tudásbázisunkba, hogy ezzel is segítsük a későbbi vagy más által elvégzett elemzéseket az adott területről származó adatokon.

Dolgozatomban virtualizált infrastruktúrák valós mérési adatokon alapuló teljesítményelemzését viszem végig az elkészült eszközzel, amely a tudásbázis tárolására gráf alapú adatbázist, az adatok feldolgozására pedig R statisztikai környezetet használ. Megvizsgálom, hogy a tetszőleges adatforrásból, ill. adatbázis-technológiából származó adatokat hatékonyan tudom-e megtisztítani, előkészíteni az elemzésre, és képes vagyok-e új ismeret feltárására az adatelemzés során.

Mindezek mellett a segédeszköz elkészítése során figyelembe veszem, hogy az tetszőleges más szakterület esetén is alkalmazható legyen, akár más adatelemző eszköz alkalmazásával is. Ezen kívül lehetőséget biztosít az elemzés során vizsgált rendszer (pl. virtualizált infrastruktúra) vagy a mérési módszerek változásának lekövetésére is. Végül bemutatok néhány gyakorlati példát arra, hogyan lehet a módszert alkalmazni más szakterületeken.

szerző

  • Nádudvari György
    mérnökinformatikus
    nappali

konzulens

  • Dr. Gönczy László
    docens, Méréstechnika és Információs Rendszerek Tanszék

helyezés

Egyetemi Hallgatói Képviselet III. helyezett