Regisztráció és bejelentkezés

Mély tanulás alapú részvényanalízis pénzügyi hírek alapján

Az emberi nyelv tanulmányozása egy különösen komplex kutatási terület. Bár szabályokon alapul, de ezek alól sokszor számos kivétel van, valamint rengeteg szónak kontextustól függően más jelentése lehet és mindezeken felül az idővel az egész változik. Az elmúlt években a gépi tanulás - azon belül is a neurális hálókkal foglalkozó területe - hatalmas fejlődésen esett keresztül. Egyre több olyan modell jelent meg ami nem csak a szövegek feldolgozására készült, hanem a nyelvben rejlő összefüggések modellezését célozza meg. A természetes nyelvfeldolgozás egyik fontos területe a szövegek osztályozása, amihez az előbb említett képesség elengedhetetlen.

Az utóbbi időben megemelkedett azoknak a kutatásoknak a száma is, amelyek a neurális hálók pénzügyi területen történő alkalmazását vizsgálják. Ezeknek az egyik legnagyobb kihívás az adatoknál jelentkező kifejezetten alacsony jel-zaj viszony. Általában csak a múltban megfigyelt árfolyammozgások alapján nem lehet megmondani, hogy a jövő hogyan alakul. Azonban pszichológiai kutatások bizonyítják, hogy az információkon felül az emberek befektetési döntéseit jelentősen befolyásolják az érzelmeik és a hangulatuk. Az internet és a közösségi média korában az emberek gyakran osztják meg a gondolataikat és érzéseiket ezeken a platformokon így hatalmas mennyiségű adat áll rendelkezésre a tőzsdéken kereskedők hangulatáról.

A kutatás célja egy olyan modell megalkotása, amely a közösségi platformokon megosztott hírek és bejegyzésekről képes megállapítani, hogy melyik részvényhez tartoznak és ezt a tudást felhasználva a későbbi adatok elemzésénél segítséget nyújt abban, hogy egy adott hír milyen hatással van más árfolyamokra, valamint abban, hogy feltárjuk az egyes részvények közötti hasonlóságokat és összefüggéseket. Ez a tudás a tőzsdén jelentős előnyt biztosíthat mivel profi kereskedők számára is kifejezetten nehéz feladat. Ezen felül megpróbál megoldást keresni a természetes nyelvfeldolgozás egyik fontos problémájára is, ami abból adódik, hogy a tanításhoz használt adatok eloszlása erősen kiegyensúlyozatlan, valamint bizonyos témák közelebb esnek egymáshoz így ezeket nehezebb megkülönböztetni egymástól, mint a többitől.

szerző

  • Torner Márton
    Mérnök informatikus szak, alapképzés
    alapképzés (BA/BSc)

konzulensek

  • Dr. Gyires-Tóth Bálint
    adjunktus, Távközlési és Médiainformatikai Tanszék
  • Dr. Szaszák György
    tudományos munkatárs, Távközlési és Médiainformatikai Tanszék