Regisztráció és bejelentkezés

Új mohó algoritmus vine-kopulák megépítésére

A többdimenziós eloszlások modellezésében fontos szerepet kaptak a kopulák, mivel segítségükkel külön modellezhető a valószínűségi változók közötti összefüggések és a peremeloszlások.

Magasabb dimenzióban a változók közötti összefüggések ritkán írhatók le egy fajta kopulával, ezért T. Bedford és R.M. Cooke 2001-ben bevezették a vine–kopulákat [1]. Ezek a speciális kopulák egy sokkal rugalmasabb lehetőséget biztosítanak a többdimenziós valószínűségi eloszlások modellezésben, mivel a felírásukban, csupán a pár-kopulákat illetve feltételes pár-kopulákat használnak.

A vine kopulákban szereplő párkopulákat hozzárendelték egy speciális gráf-struktúra sorozathoz [2]. Ilyen módon reprezentálhatóvá válik grafikusan is a vine-kopula. Továbbá a gráf-struktúra sorozatot egy speciális mátrixban lehet megjeleníteni [3]. Dolgozatomban, miután ismertetem a gráf, a mátrix és a vine-kopula analitikus felírása közötti összefüggéseket a szakirodalom alapján, olyan problémákat fogalmazok meg, amik legjobb tudomásom szerint az eddigi szakirodalomban nem szerepeltek. Ezen sajátosságok figyelembevételével egy új mohó algoritmust mutatok be, ami a vine-kopulák mohó felépítésére szolgál. Az algoritmus célja az erős összefüggéseket az első „fákban” (speciális hipergráfok) megfogni.

A bevezetett eljárás több fontos szempontot is szolgál egyszerre. Az egyik az, hogy amennyiben az erős összefüggéseket a bevezetett mohó algoritmus alapján megtartjuk az első fákban, úgy egy vágást elvégezve (utolsó fák elhagyása [4]) az eredeti kopula egy közelítését kapjuk. Megmutatjuk, hogy bizonyos feltételek mellett ez a közelítés minimalizálja a Kullback-Leibler divergenciát. Egy másik fontos szempont az, hogy egy magas dimenziós valószínűségi eloszlásra tudunk úgy közelítést adni, hogy csak alacsony dimenziós peremeit használjuk föl, amiket egy adott mintából megbízhatóbban lehet megbecsülni, mint a teljes eloszlást. Az eredmény mögött az az ötlet áll, hogy az algoritmus által, olyan vágást találhatunk, ami felfedezi/megközelíti a valószínűségi változók közötti globális Markov struktúrát. Tehát ez a struktúra az alacsony dimenziós peremekkel együtt adja meg a közelítést. Az új algoritmus azt is lehetővé teszi, hogy az összes két dimenziós perem információ tartalmán kívül, csak bizonyos magasabb rendű peremek információ tartalmát kell kiszámolnunk, ezzel jelentősen csökkentve a futási időt.

Dolgozatomban ötvözöm a gráfelméleti, valószínűségszámítási, információelméleti és kombinatorikai ismereteimet. Az algoritmusokat Python-ban implementálom.

[1] Bedford, Tim, and Roger M. Cooke. "Vines--a new graphical model for dependent random variables." The Annals of Statistics 30.4 (2002): 1031-1068.

[2] Bedford, Tim, and Roger M. Cooke. "Probability density decomposition for conditionally dependent random variables modeled by vines." Annals of Mathematics and Artificial intelligence 32.1 (2001): 245-268.

[3] Nápoles, O. Morales. Bayesian belief nets and vines in aviation safety and other applications. Delft: TU, 2009.

[4] Brechmann, Eike C., Claudia Czado, and Kjersti Aas. "Truncated regular vines in high dimensions with application to financial data." Canadian Journal of Statistics 40.1 (2012): 68-85.

szerző

  • Pfeifer Dániel
    Matematikus mesterképzési szak (MSc)
    mesterképzés (MA/MSc)

konzulens

  • Dr. Kovács Edith Alice
    Docens, Differenciálegyenletek Tanszék

helyezés

I. helyezett