Nedavni napredek v visoko zmogljivem sekvenciranju bioloških podatkov je privedel do nastanka velikih podatkovnih naborov RNK na ravni posameznih celic. Ti novi nabori podatkov nam omogočajo boljše razumevanje bioloških sistemov, ki so v ozadju bolezni, kot je rak prostate. Predstavljamo metodo, ki temelji na linearni diskriminantni analizi, s katero učinkovito filtriramo najmanj informativne gene iz pridobljenih podatkov o RNK na ravni posameznih celic, ki vsebujejo celice raka prostate. S to metodo izboljšamo razločevalno moč nabora podatkov. Razvijemo tudi novo metodo za ekstrakcijo modelov brez potrebe po ročni določitvi parametrov. Nato uporabimo to metodo skupaj z javno dostopnim metabolnim modelom na nivoju genoma za generiranje podatkov o reakcijskem toku znotraj vsake celice. Nato te podatke primerjamo s podatki o RNK na ravni posameznih celic in analiziramo ločene modele naključnih gozdov za klasifikacijo celic iz vzorcev raka prostate. Rezultati klasifikacije in analiza pomembnosti atributov kažejo, da so podatki o RNK bolj informativni za razlikovanje vrst celic iz vzorcev raka prostate kot podatki o reakcijskem toku.
|