Regisztráció és bejelentkezés

Megosztott cache heterogén multiprocesszoros rendszerekben

A processzorgyártók a számítási teljesítmény növeléséhez a CPU magok mellé GPU magokat kezdenek integrálni, mert a korábban alkalmazott technikák (órajel frekvencia növelése, több magos processzorok) fizikai akadályok miatt már csak korlátozott mértékben alkalmasak a sebesség további növelésére. Azokat a processzorokat, amelyek különböző típusú processzormagokból épülnek fel, heterogén processzoroknak nevezik. A heterogén processzorok még nem terjedtek el széles körben, de a jövőben ez várhatóan változni fog. A memóriák sávszélessége és késleltetése nem fejlődik olyan mértékben, mint a processzorok teljesítménye, ezért a gyorsítótár (\textit{cache}) egyre fontosabb a maximális teljesítmény eléréséhez, azonban a korábban alkalmazott gyorsítótár menedzselési módszerek heterogén processzorok esetén nem alkalmazhatóak az eltérő működésű magok miatt.

Munkám célja egy heterogén processzorban alkalmazott közös gyorsítótár működésének optimalizálása volt. A MacSim szimulátor és különböző tesztprogramok felhasználásával megvizsgáltam a CPU és GPU magok eltérő viselkedését a memória-alrendszer szempontjából. A szimulációs eredmények azt mutatták, hogy a CPU magok sokkal érzékenyebbek a gyorsítótár méretére, mint a GPU magok, azonban az utóbbiak mégis nagyobb részt foglalnak el a közös gyorsítótárból.

A szakirodalom is foglalkozik a heterogén processzorok megosztott gyorsítótárjának menedzselésével, azonban az eddigi publikációk nem vették figyelembe a tesztprogramok adatméreteinek hatását a gyorsítótár igényre. A dolgozatban bemutatott új algoritmus a közös gyorsítótárat particionálja a CPU és GPU magok között az egyes magokon végrehajtott alkalmazások igényeinek és az adatméretek függvényében.

szerző

  • Jani Lázár
    villamosmérnöki
    nappali

konzulens

  • Dr. Mann Zoltán
    egyetemi docens, Számítástudományi és Információelméleti Tanszék