Regisztráció és bejelentkezés

Gráf konvolúciós neurális hálózatok és bioinformatikai alkalmazásaik

A mély tanulási módszerek komoly áttörést hoztak a beszédfelismerés, a gépi fordítás és a képfeldolgozás területén. Más alkalmazási területeken azonban nem rácsokon, hanem gráfokon mintavételezett jelekkel kell dolgoznunk. Jelenleg egyre nagyobb érdeklődés övezi a gráfokkal dolgozó mélytanuló algoritmusokat, ezek ugyanis lehetővé teszik a valóságban előforduló komplex hálózatok modellezését.

Jelen dolgozatban csúcsok osztályozásával és élek előrejelzésével kapcsolatos problémák megoldását mutatom be. Ehhez egy variációs autoenkódert használok különféle gráf konvolúciós rétegekkel, köztük egy újszerű, a Lánczos-algoritmus alapján tervezett spektrális réteggel. Az egyes feladatokat saját érdeklődésemnek megfelelően, a bioinformatika nyitott kihívásai közül választottam.

Az első feladatban a csúcsok osztályozását és élek előrejelzését nagyméretű gráfokon valósítom meg. Ebben az esetben a batch-enként történő tanítás elkerülhetetlen, de az összefüggő adatszerkezet miatt nemtriviális módszert igényel. A problémát a Cluster-GCN-hez hasonló módon, véletlen részgráfok képzésével oldom meg.

A második feladatban gén ontológiák osztályozását hajtom végre a STRING adatbázis fehérje-fehérje kölcsönhatási hálózatai alapján. A deepNF algoritmusban a hálózatok egyesítését egy autoenkóder végzi, majd egy SVM osztályozó azonosítja a gén ontológiákat. Ezt az algoritmust fejlesztem tovább, a gráf konvolúció erősségeire építve.

Végül, a harmadik feladatban, betegség-gén kölcsönhatások előrejelzését kísérlem meg a DisGeNet tudásbázis alapján. Feltételezem, hogy az autoenkóder által rekonstruált, de az eredeti adathalmazban nem szereplő élek valójában újonnan felfedezett betegség-gén kapcsolatok. A feltételezést szakirodalmi bizonyítékkal próbálom alátámasztani.

A kiértékelés igazolja, hogy a gráf konvolúció alkalmazásával sikeresen elvégezhetjük a legfontosabb, gráfokkal kapcsolatos modellezési feladatokat, a tervezett architektúrával pedig state-of-the-art eredmények érhetők el.

szerző

  • Unyi Dániel
    Egészségügyi mérnök szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Gyires-Tóth Bálint
    adjunktus, Távközlési és Médiainformatikai Tanszék