Regisztráció és bejelentkezés

Nyílt forráskódú OCR szoftver felhasználása igazolvány adatok ellenőrzésére

Egy személy magát mind a valós, mind a virtuális világban valamely hivatalos szerv által kiállított igazolvány segítségével tudja igazolni. Ezeknek a szerepe az internet egyre szélesedő területeivel szintén nőtt. Elsősorban a szerencsejáték, pénzügyi, vagy az állam által törvényileg szabályozott területeken működő szervezetek megkövetelik minden beregisztrálónál az azonosítást, ezzel kiszűrve a nem létező személynek kiadó, illetve a más adataival visszaélő felhasználókat.

A kártyák ellenőrzését a először emberi erőforrásból oldották meg. Ez kisebb cégek esetén kivitelezhető, a regisztrálók növekedésével azonban nehezen és költségesen tud csak lépést tartani.

Az elmúlt évek hatalmas technológia fejlődései elérhetővé tették, hogy a nagy számítási komplexitásnak minősülő karakterfelismerést (OCR) szoftverek is el tudják végezni elfogadható időn belül. Ez történhet a felhőben, illetve lokálisan az adott szerveren.

Bár felhő alapú karakterfelismerő szoftverek már nagy számban találhatóak (pl. Google Cloud Vision, Microsoft Azure, ABBYY Cloud OCR, BlinkID), ezekért mind bizonyos mértékben fizetni kell. Lokálisan futó megoldás már kevesebb van, és ezek közül is csak egy ingyenes, nyílt forráskódú, jelenleg is fejlesztés alatt álló OCR létezik, a (szintén Google által fenntartott) Tesseract.

Ezek a megoldások képesek egy képen található dokumentum beolvasására, az adatok ellenőrzésére azonban a naív megoldáson kívül, ahol összehasonlítjuk az OCR által kinyert szöveget a felhasználó által megadotttal, egyik szoftver se ad lehetőséget.

Dolgozatomban erre a problémára szeretnék egy nyílt forráskódú, könnyen használható megoldást találni. Első lépésként konkrétan az adóigazolványon található adatokat szeretném igazolni, viszont ezt a későbbiekben könnyen általonsíthatóan szeretném megoldani. Ennek megvalósításához az OpenCV képfeldolgozó könyvtárat fogom összekötni a Tesseract karakterfelismerő programmal annak érdekében, hogy minél pontosabb eredményeket kapjak.

szerző

  • Pásztor Dániel
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Ekler Péter
    Adjunktus, Automatizálási és Alkalmazott Informatikai Tanszék