Regisztráció és bejelentkezés

Neurális háló alapú few-shot tanulás új betegségek képi felismeréséhez

A gépi tanulás (kiemelten a deep learning) technológiák eredményes használatának szükséges, (de nem elégséges) feltétele a tanítóadatok nagy mennyiségben való rendelkezésre állása. Ennek a feltételnek számos alkalmazási területen nem lehet eleget tenni, legtöbb esetben az elérhető ismeretek hiánya vagy a szakértői tudás túlzott költségei miatt. A TDK dolgozatban bemutatott kutatási téma is egy ilyen adatokban gyakran hiányt szenvedő terület, az orvostudományban dolgozók munkáját szándékozik segíteni patológiás felvételek elemzésével, a lehető legkevesebb tanítókép felhasználásával. A választott kísérleti forgatókönyv egy manapság különösen aktuális kérdés: hogyan lehetne korábbi betegségek jellemzőmintáinak felhasználásával egy új betegséget diagnosztizálni, amelyről csak korlátozott számban állnak rendelkezésre adatok?

A kevés adatból való, azaz a „few-shot” tanulás során a modellnek az egyes osztályokból csak néhány mintát mutatunk, így az osztályozási feladat nehézségét az osztályokhoz társított, egyedi feature jellemzők minél gyorsabb és pontosabb megtanulása jelenti. Az ilyen fajta meta-tanulás során szükséges a cél képhez „hasonló” tanító képek magas szintű jellemzőinek „tudás transzfer”-szerű megtanulása. Ennek a technikának az alkalmazásával lecsökkenthető a szükséges tanítási minták száma. Vannak ugyan olyan modellek, melyek a feladatot képesek megoldani, jelen pályamunkában azonban egy új, a korábbi megoldásoktól eltérő, továbbfejlesztett módszer került elkészítésre, amely a Matching Network architektúrára épül.

A dolgozat első fejezetei mélységeiben tárgyalják a „few-shot” típusú gépi tanulás hipotézistérben vizsgált elméletét és annak határait a Hilbert terekben, majd erre építve bemutatásra kerülnek a „few-shot” tanulás haladó technikái és alkalmazási lehetőségei. A dolgozatban bemutatásra kerül a továbbfejlesztett Matching Network, kiemelt figyelmet fordítva a figyelmi mechanizmusra és neurális háló architektúrára, amely képes több-nézőpontos felvételek felismerésére is. Végezetül az új modell teszt eredményei kerülnek részletezésre: a kiértékeléshez kialakított környezetben „ismeretlen” COVID-19 tüneteket mutató felvételek osztályozása pár minta felhasználásával, kizárólag más betegségek felvételein történő előzetes meta-tanulással.

szerző

  • Németh Marcell
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Szűcs Gábor
    egyetemi docens, Távközlési és Médiainformatikai Tanszék