izpis_h1_title_alt

Napovedovanje aminokislin v interakciji z RNA
ID Borštnik, Tomaž (Avtor), ID Curk, Tomaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

URLURL - Predstavitvena datoteka, za dostop obiščite http://eprints.fri.uni-lj.si/3174/ Povezava se odpre v novem oknu

Izvleček
Interakcije med proteini in RNA imajo pomembno vlogo pri uravnavanju genske ekspresije in posledično na delovanje celic. Napake v interakcijah so pogosto povezane z nastankom bolezni, kot so nevropatije, rak, itd. Poznavanje mest interakcij je tako nujno za razumevanje, odkrivanje, uravnavanje genske ekspresije in zdravljenje omenjenih bolezni. V magistrskem delu smo se osredotočili na modeliranje mesta interakcije proteinov z RNA na osnovi simuliranih podatkov metode RBDmap, ki je nadaljevanje študije Castella in sodelavcev, objavljene leta 2012. Podatke RBDmap smo simulirani na podlagi zbirke PDB, ki hrani strukture 3D kompleksov proteinov in RNA. Za napovedovanje posameznih aminokislin oziroma krajših zaporedij v fragmentih smo preizkusili vrsto metod strojnega učenja, kot so metoda podpornih vektorjev, klasifikacijska drevesa, naivni Bayesov klasifikator in K-najbližjih sosedov. Razvili smo tudi metodo, ki določi aminokisline v interakciji z RNA na podlagi lastnosti fragmentov aminokislin in celotnega proteina. Uspešnost metode je primerljiva s trenutno obstoječimi metodami (AUC 0,783). V nasprotju s pričakovanji, opisovanje fragmentov v splošnem ni pripomoglo k izboljšanju napovednih modelov.

Jezik:Neznan jezik
Ključne besede:gradnja modelov, neuravnoteženi podatki, protein-RNA, PDB
Vrsta gradiva:Magistrsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2015
PID:20.500.12556/RUL-72825 Povezava se odpre v novem oknu
Datum objave v RUL:03.10.2015
Število ogledov:1306
Število prenosov:214
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Neznan jezik
Naslov:Prediction of amino acids interacting with RNA
Izvleček:
Interactions between proteins and RNA play an important role in the regulation of gene expression and therefore in the functioning of cells. Errors in interactions are often related to the development of diseases, such as neuropathy, cancer, etc. To this end, knowing the locations of interactions is crucial for understanding, discovering and managing gene expression and for treating those diseases. The master's thesis focuses on modeling the amino acids interacting with RNA based on simulated data on RBDmap experiments, which is the continuation of the study by Castello et al. from 2012. RBDmap was simulated using the PDB database on 3D structures of ribonucleoprotein complexes. A number of methods of machine learning, such as support vector machines, classification tree, naive Bayes classifier and k-nearest neighbours were evaluated for predicting individual amino acids and fragments of amino acids interacting with RNA. Moreover, a method was developed to determine amino acids interacting with RNA, which considers the characteristics of fragments of amino acids and the entire protein. The method achieved good results (AUC 0.783), which is comparable with current methods. Including features on fragments did not improve the predictive model.

Ključne besede:building models, imbalanced data, protein-RNA, PDB

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj