Regisztráció és bejelentkezés

Szövegdokumentumok összefoglalóinak automatikus előállítása

A mindennapokban keletkező nagy mennyiségű struktúrálatlan szöveges adat feldolgozása szerkezetéből és méretéből kifolyólag hagyományos eszközökkel már nehezen valósítható meg. Ezért egyre nagyobb hangsúly helyeződik a szövegbányászatra, amely olyan korszerű megoldásokat foglal magában, melyek megkönnyítik a nyers adatokban rejlő összefüggések kinyerését. A szöveganalitika egyik legnagyobb kihívása a természetes nyelvű dokumentumok tartalmának rövid, de pontos összefoglalása, melyet kivonatolásnak hívnak. A kivonatolás egy olyan összetett feladat, mely a szöveg megértését és a releváns információk kinyerését egyidejűleg igényli. A feladat megoldásának két megközelítése létezik, így két nagy típust tudunk megkülönböztetni: egy absztrakt és egy kinyerés alapú összefoglaló generáló rendszert.

A dolgozatom célja különböző automatikus kivonatoló rendszerek a megtervezése és megvalósítása volt. Az első részben bemutatom a kivonatolást és annak jelentőségét, valamint a feladathoz felhasznált technológiákat. Ezt követően részletesen ismertetem a gépi tanuláson (mély neurális hálón) alapúló összefoglaló generáló rendszer felépítését, a tervezéskor hozott döntések indokoltságát és az elért eredményeket. A dolgozatomat végül a különböző kivonatoló rendszerek bemutatásával, értékelésével és összevetésével zárom.

szerző

  • Huszti Dorottya
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Dr. Szűcs Gábor
    egyetemi docens, Távközlési és Médiainformatikai Tanszék