Regisztráció és bejelentkezés

Mély megerősítéses tanulás alapú Hive játékos

Jelen dolgozat egy napjainkban egyre hangsúlyosabb témát, a mesterséges intelligencia alapú társasjáték ágenseknek a témakörét taglalja,

egy olyan konkrét stratégiai táblajátékkal kapcsolatban, amire napjainkban még nem léteznek effektív algoritmusok.

A dolgozat célja a Hive elnevezésű stratégiai táblajáték játszására képes mester-

séges intelligencia ágens megtervezése és implementálása.

A Hive egy kétszemélyes táblajáték, melyben a játékosok különböző köveket helyezhetnek le és mozgathatnak a

játék szabályainak megfelelően. A játék célja körülkeríteni az ellenfél játékosának méhkirá-

lynőjét. Az intelligens ágens tervezése szempontjából a feladat különleges - a sakk és go játékoktól eltérő - kihívása, hogy a játékhoz

nem tartozik tábla, a kövek önmagukban alkotják a játékteret.

A projekt célja egy olyan mély megerősítéses tanulás alapú algoritmus létrehozása,

mely megközelíti a Hive játékosok teljesítményét. Ennek a célnak az elérése végett szük-

ség van egy olyan szoftveres környezet létrehozására, melyben a tanuló eljárást futtatni és

tesztelni lehet.

A feladat célkitűzését a DeepMind nevű brit cég AplhaGo Zero nevű szoftvere ihlette, mely egy intelligens ágens a

Go társasjátékhoz. Az ágens játékokat futtatva önmaga ellen felparaméterez egy mély neurális hálót, mely segítségével

az ágens a döntéseit hozza.

A dolgozat végigkíséri az olvasót a szoftver tervezésének és implementációjának

menetén, illetve összegzést nyújt a feladat elméleti hátteréről.

szerző

  • Bunth Tamás
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Gyires-Tóth Bálint
    adjunktus, Távközlési és Médiainformatikai Tanszék