Regisztráció és bejelentkezés

Gyógyszer hatóanyag jelöltek keresése és optimalizálása a molekulák terében

Napjainkban az új gyógyszermolekulák kifejlesztésének egy kulcsfontosságú lépése a molekulajelöltek kiválasztása. A kiválasztott molekulák szintetizálása és tesztelése igen időigényes és költséges feladat, ezért szükséges, hogy egy megfelelő halmazt válasszuk meg. A generatív modellezés lényege, hogy megtanuljunk olyan molekulákat mintavételezni, amik megfelelnek több kikötésnek is. Ez a folyamat automatizálható és több megközelítés is létezik ennek megoldására. A dolgozatomban megvizsgálok és összehasonlítok két state-of-the-art de novo módszert az egy- és több-cél szerinti molekula generálásra. A két modell a SeqGAN, ami egy általános szekvencia generálásra alkalmas módszer és a MolDQN, ami a molekula generálást Markov Döntési Folyamatként modellezi. Ahhoz, hogy ezek a modellek tudják feldolgozni és értelmezni a molekulákat, megfelelő reprezentációt kell választanunk. A molekulák szekvenciális reprezentációjára a SeqGAN modellhez SMILES-t használtam. A MolDQN számára ugyan lehetne használni szintén ezt, a Morgan Fingerprint-et használva gyorsabb és stabilabb lesz a tanítás (ez a fajta reprezentáció bináris vektorok formájában kódolja a molekulákat). A két modell mellett bemutatok egy hibrid modellt, ami a SeqGAN-ra épül és a MolDQN-nél is használt jutalomfüggvényeket alkalmazza. Végül összehasonlítom ezeket más state-of-the-art módszerekkel olyan jellemzők szerint, mint: validitási arány, gyediségi arány, újdonsági arány és diverzitás, melyek a modellek jóságát számszerűsítik.

[1] ZHOU, Zhenpeng, et al. Optimization of molecules via deep reinforcement learning. Scientific reports, 2019, 9.1: 1-10.

[2] YU, Lantao, et al. Seqgan: Sequence generative adversarial nets with policy gradient. In: Thirty-first AAAI conference on artificial intelligence. 2017.

szerző

  • Kiss Richárd
    Mérnök informatikus szak, alapképzés
    alapképzés (BA/BSc)

konzulens

  • Sárközy Péter
    Tudományos Segédmunkatárs, Méréstechnika és Információs Rendszerek Tanszék