Regisztráció és bejelentkezés

Mély megerősítéses tanulás alapú algoritmikus kereskedés ensemble modellekkel

A pénzügyi szektorban algoritmikus kereskedésnek számít minden olyan kereskedési mód, ahol a megbízás paramétereinek (időzítés, ár, mennyiség) meghatározását, valamint a megbízás kezelését egy számítógépes algoritmus végzi, korlátozott emberi beavatkozással vagy emberi beavatkozás nélkül. A TDK dolgozatot eredményező kutatás célja olyan módszereket találni, mély megerősítéses tanulási modelleket kidolgozni és fejleszteni a kereskedés végrehajtására, amelyekkel maximalizálható a bevétel és minimalizálható a befektetés kockázata.

A szakirodalomban mély megerősítéses tanulást alkalmazó fejlesztésekkel már bizonyították a gépi kereskedő algoritmusok létjogosultságát a portfóliók kezelésében. Jelen kutatás célja, hogy hogyan lehet minél robusztusabb megerősítéses tanuló modellt készíteni, amely képes változó kockázatvállalási hajlandóságú kereskedést szimulálni a piac dinamikájához igazodva a portfólió értékének maximalizálása és a kockázat, illetve egyéb negatív következmények minimalizálása mellett.

A dolgozat a megerősítéses tanulás state-of-the-art módszereinek elméleti áttekintésével kezdődik, kiemelt figyelmet fordítva az egyes algoritmusok, modellek gyakorlati előnyeire és hátrányaira. Ezt követően bemutatásra kerül az új fejlesztések alapját biztosító kiinduló ensemble kereskedő modell a szimulációs részvénypiaci környezet, a piac dinamikájának modellezéséhez használt faktorok és adatok ismertetése mellett.

A TDK munka központi része egy új, a feature-ök szétosztásán és párhuzamosan tanuló ágensek döntés optimalizálásán alapuló ensemble technikát mutat be, amely képes az alapot jelentő fejlesztés eredményeinek felülteljesítésére. A kezdetben egyetlen ágenst, amely az összes bementi feature által alkotott térben tanult, leváltja több modell, amelyek bemeneti faktorai célzottan, statisztikai módszerek alapján összeállított, egy-egy technikai indikátor csoportot fednek le. A párhuzamosan tanuló modellek az egyes csoportokat felhasználva a piac dinamikájának egy-egy részét “látva” tudnak elfogulatlan döntést hozni, amelyek a Markov-folyamat legvégén aggregálásra kerülnek, így eredményezve egy robosztus döntést.

További fejlesztések kerülnek tárgyalásra az egyes modellek jutalomfüggvényeit taglalva. Az ágensek elosztott működése egyben különböző jutalom maximalizálási lehetőségeket is lehetővé tett: eltérő célfüggvények segítségével rugalmasabban kezelhetőek a kereskedési paraméterek, amelyek ezáltal nagyobb fokú átláthatóságot is biztosítanak a modell működését illetően.

szerző

  • Németh Marcell
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Szűcs Gábor
    egyetemi docens, Távközlési és Médiainformatikai Tanszék

helyezés

I. helyezett