Regisztráció és bejelentkezés

Hosszú mintákat illesztő algoritmusok vizsgálata és implementálása

A szuffix-fák és szuffix-tömbök jól ismertek arról, hogy effektíven képesek rengeteg szövegfeldolgozással kapcsolatos problémát megoldani, mint például a pontos mintaillesztést, aminek rengeteg felhasználási területe van például a keresőmotorok vagy a természetes nyelvfeldolgozás területén.

Ebben a dokumentumban mutatunk egy alternatív, tisztán hash táblára épülő megoldást, valamint összehasonlítjuk a hash táblás módszert a szuffix-fát illetve szuffix-tömböt használó megközelítésekkel. A méréseket különböző típusú szövegekre külön végezzük (például XML, DNS szekvencia, természetes nyelv), hogy az egyes módszerek jellegzetességére jobban rávilágítsunk.

A mérések eredménye azt mutatja, hogy több területen a hash táblát használó algoritmus nagyobb hatékonysággal képes nagy mennyiségű mintát illeszteni, mint a gyakorlatban széles körben elterjedt szuffix-tömb alapú megoldás.

szerző

  • Galkó Ferenc
    mérnökinformatikus
    nappali

konzulens

  • Dr. Juhász Sándor
    projektvezető, Mirango Kft. (külső)