Regisztráció és bejelentkezés

Hangasszisztens kontextuális gépi fordítással Androidra a nagy nyelvi modellek támogatásával

A mai felgyorsult világban az emberek minden feladatukat gyorsabban szeretnék elvégezni, mint azt eddig szokták. Időt akarunk nyerni ott, ahol tudunk, nincs ez másképp a mobiltelefonunk használata során sem. A hangasszisztensek elengedhetetlen eszközként tűnnek fel, amelyek zökkenőmentesen illeszkednek mindennapi életünkbe, széles körű előnyöket kínálva, és növelve az hatékonyságot, a termelékenységet és az elérhetőséget.

A hangasszisztensek használata során egyszerű hangutasítások segítségével a felhasználók időzítőt állíthatnak be, hívást kezdeményezhetnek vagy üzenetet írhatnak és különböző feladatokat végezhetnek el anélkül, hogy fizikailag gépelniük vagy több alkalmazáson keresztül navigálniuk kellene. Ezáltal a feladatok egyszerűsítése lehetővé teszi az emberek számára, hogy nagyobb hangsúlyt fektessenek a fontos tevékenységekre, maximalizálva ezzel az idejüket és hatékonyságukat.

Azonban egy nagy hátrányukról nem feledkezhetünk meg: a jelenleg piacon található szoftverek zöme a legnagyobb nyelveket támogatja egyedül, hátrahagyva a világ többi részét, melyek anyanyelve nem használható az ilyen jellegű funkciókra.

Kutatásaim során erre kerestem a megoldást, hogy a modern mesterséges intelligencia, többek között a mondatbeágyazás, a hangfelismerés, valamint a nagy nyelvi modellek segítségével hogyan tudnék egy ilyen asszisztenst fejleszteni, amit akár kicsiny hazánk nyelvén is lehetne vezérelni. Az asszisztens két fő egységre bontható. Az egyik maga az Android alkalmazás, itt történik az utasítások kiadása, valamint a végrehajtása is. A másik része egy számítógépen futó szerver, ami a háttérben megbújva kommunikál az alkalmazásunkkal.

Ez a szerver az alkalmazásunk lelke, hiszen itt történik a parancsfeldolgozás, a beérkezett hangalapú vagy szöveges kérésekre válaszként a futtatandó függvényt, valamint a paramétereit adja. Ez alapján az Android alkalmazás az elküldött kérés után pár másodpercen belül megkapja a futtatandó függvényt, amit ő ezután egyből végre is hajt.

A dolgozatom során újszerű és innovatív megoldásokat dolgoztam ki a mesterséges intelligencia segítségével, mely a hangasszisztensek képességeit jelentősen fel tudja javítani. Bemutatok olyan felhasználási területeket, melyek akár más környezetben, más platformon is megvalósíthatók lehetnek és alapjául szolgálthatnak további intelligens asszisztensek fejlesztésére.

szerző

  • Szelle Csaba
    Mérnök informatikus szak, alapképzés
    alapképzés (BA/BSc)

konzulens

  • Dr. Ekler Péter
    Docens, Automatizálási és Alkalmazott Informatikai Tanszék

helyezés

III. helyezett