Moderne tehnike analize celičnih podatkov omogočajo globlje razumevanje bolezni in razvoj učinkovitejših terapij. V zadnjem času so bili razviti temeljni modeli — napredne nevronske mreže, ki se učijo na ogromnih količinah podatkov — in predstavljajo pomemben napredek pri analizi celičnih procesov. Ker pa so bili ti modeli večinoma učeni na človeških celicah, ostaja odprto vprašanje, ali je njihovo znanje mogoče uspešno prenesti tudi na evolucijsko oddaljene organizme.
V magistrskem delu smo se posvetili prav temu vprašanju. Kot testni primer smo izbrali socialno amebo Dictyostelium discoideum, ki je od človeka evolucijsko oddaljena več kot milijardo let, hkrati pa je biološko dobro raziskana. Sistematično smo primerjali različne pristope k analizi celičnih podatkov: od tradicionalnih metod (PCA) do najnovejših temeljnih modelov, vključno z Geneformer, scGPT in Universal Cell Embedding (UCE).
Rezultati kažejo, da lahko temeljni modeli učinkovito analizirajo tudi evolucijsko oddaljene organizme, pri čemer se je kot najuspešnejši izkazal pristop UCE. Ta temelji na analizi proteinskih sekvenc namesto imen genov, kar mu omogoča prepoznavanje funkcionalnih podobnosti ne glede na evolucijsko razdaljo. UCE je uspešno prepoznal različne tipe celic, ključne signalne poti in razvojne prehode v amebi, kar dokazuje, da obstajajo univerzalna načela celičnega delovanja. Naša raziskava tako odpira pot za uporabo temeljnih modelov pri preučevanju širokega spektra organizmov brez potrebe po dodatnem učenju modelov.
|