Regisztráció és bejelentkezés

A depresszió beszéd alapú felismerésének vizsgálata több nyelvre érvényes modellek segítségével

A beszéd az emberi kommunikáció legáltalánosabb eszköze, ami nyelvi kódot közvetít. Ez a kommunikációs forma rendkívül összetett folyamatok összessége, amit számos környezeti, illetve szervezeti tényező befolyásol. Nemcsak érzelmi hatásokra változik meg a beszéd, hanem bizonyos fiziológiai, illetve pszichiátriai tényezők, akár betegségek jelenlétében is. A beszéd mikrofonnal történő felvételével és a beszédproduktum mélyebb vizsgálatával lehetőség nyílhat különböző betegségek felismerésére.

A depresszió korunk egyik leggyakoribb betegsége, amely hatással van a betegségben szenvedő egyén életminőségére és munkavégző képességére is. Bizonyított, hogy a depresszió képes megváltoztatni az egyén beszédproduktumát, emiatt jelenünk egy fontos kutatási területe a depresszió beszéd alapú automatikus felismerése.

Dolgozatomban a főként beszélőfelismerésre használt x-vector technikát alkalmazva vizsgálom a depresszió beszéd alapú felismerésének lehetőségeit. A rendelkezésemre álló, beszédproduktumokból álló adatbázisok adatpontjaiból egy mély neurális háló segítségével hozok létre x-vektorokat. Ezen x-vektorok alkotják a tanuló eljárásom bemenetét, amely egy szupport vektor regresszió, Vizsgálataim során létre hozok olyan modelleket is, amelyek tanítóhalmazának és teszthalmazának nyelve azonos és olyan modelleket is, amelyeknél különbözőek. Célom az eljárás nyelvfüggőségének vizsgálata ezen modellek eredményeinek összehasonlítása által.

szerző

  • Ramács Gábor
    Mérnök informatikus szak, mesterképzés
    mesterképzés (MA/MSc)

konzulens

  • Kiss Gábor
    PHD hallgató, Távközlési és Médiainformatikai Tanszék

helyezés

II. helyezett