Plágiumkeresés a BME VIK diplomaterv állományában
2010 óta a Budapesti Műszaki és Gazdaságtudományi Egyetem (BME) Villamosmérnöki és Informatikai Karán (VIK) a beadott szakdolgozatok és diplomatervek elektronikus formátumban nyilvánosan hozzáférhetőek. Ez a szabad információhozzáférés mellett megnyitotta a kaput a dolgozatok tartalmának gépi feldolgozása előtt is.
Kutatásunk során a BME VIK dolgozatállományát felhasználva kidolgoztunk egy megoldást, mely képes hatékonyan elemezni, hogy milyen hasonlóságok fedezhetők fel a különböző beadott anyagokban, illetve összevetni azokat ismert külső forrásokkal. Ez utóbbi mechanizmus működését a magyar nyelvű Wikipedia adatbázison demonstráljuk.
Dolgozatunkban bemutatjuk a kialakított keretrendszerünk és algoritmusunk működését, bemutatjuk azokat az algoritmikus trükköket, melyekkel a nagy méretű szövegállomány mellett is belátható időben elvégezhető a dolgozatok összevetése. Algoritmusunk segítségével már most is számos, megfelelő forráshivatkozás nélküli egyezést azonosítottunk a dolgozatok között. A bevont forrásmunkák körének a bővítésével egy általános, megbízható plágiumdetektor állítható elő az egyetemi szféra számára.
szerzők
-
Juszt Ádám
Mérnök informatikus szak, alapképzés
alapképzés (BA/BSc) -
Bogáromi Zoltán
Mérnök informatikus szak, alapképzés
alapképzés (BA/BSc)
konzulens
-
Dr. Kővári Bence
docens, Automatizálási és Alkalmazott Informatikai Tanszék