izpis_h1_title_alt

Vektorske vložitve kemijskih struktur
ID Golobič, Bogdan (Avtor), ID Zupan, Blaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,81 MB)
MD5: E69996FF367592105717D2E7DBCEB88E

Izvleček
V raziskavah in iskanju novih zdravil nam danes pomagajo računalniške tehnologije. Že ustvarjene podatkovne zbirke so na primer lahko uporabljene za klasifikacijo kemijskih struktur. V nalogi nas je zanimala kvaliteta vektorskih vložitev kemijskih struktur z avtokodirnikom pri problemih klasifikacije, kjer bi jih lahko uporabljali kot alternativo že uveljavljenim prstnim odtisom. Arhitektura avtokodirnika sledi trendom raziskav, kjer so uporabljene konvolucijske plasti in rekurenčne enote z vrati. Samo kvaliteto vložitev smo ocenjevali na realnih podatkovnih zbirkah aktualnih učinkovin. Raziskave so pokazale, da so vektorske vložitve primerljive z že razvitimi prstnimi odtisi. Na nekaterih primerih nudi vektorske predstavitve učinkovin, ki izboljšajo točnost uporabljenih tehnik strojnega učenja. Razvili smo tudi gradnik za odprto-kodno programsko opremo Orange, ki omogoča vektorsko vložitev kemijskih struktur v notaciji SMILES tako z metodo razvito v nalogi, kot tudi z ostalimi prstnimi odtisi uporabljenimi v nalogi.

Jezik:Slovenski jezik
Ključne besede:vektorske vložitve, avtokodirnik, klasifikacija, zapis SMILES
Vrsta gradiva:Magistrsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2019
PID:20.500.12556/RUL-111797 Povezava se odpre v novem oknu
COBISS.SI-ID:1538418883 Povezava se odpre v novem oknu
Datum objave v RUL:14.10.2019
Število ogledov:1597
Število prenosov:207
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Vector embedding of chemical compounds
Izvleček:
Recent developments in computational techniques have advanced drug discovery and design. For example, standard databases with known chemicals and their modes of actions can be considered by machine learning to classify new drugs. Here, we were interested in the vectorized presentations of the structure of small molecules, a crucial first step towards any data analytics in computational chemistry. Vectorized presentations were inferred through the construction of autoencoders. We followed the current literature trends and used a combination of convolutional and recurrent layers. Experimental results show that our model is comparable to standard chemical fingerprints, where on some of the test databases even provides for improved accuracy. We published the code to infer the embedder in open source on the GitHub repository and included the embedder within the fingerprinting widget for Orange data mining suite.

Ključne besede:vector embeddings, autoencoder, classification, SMILES notation

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj