Details

Kontekstno specifična inferenca Boolovih opisov gensko regulatornih omrežij
ID Pušnik, Žiga (Author), ID Moškon, Miha (Mentor) More about this mentor... This link opens in a new window

.pdfPDF - Presentation file, Download (2,00 MB)
MD5: 6A12E297C7EFBFFFF045386F6BCA35BA

Abstract
Boolova omrežja predstavljajo učinkovit in kompakten mehanizem predstavitve interakcij in dinamike gensko regulatornih omrežij, vendar pa je izpeljava takšnih Boolovih opisov še vedno težek problem. Število eksperimentov meritev genske ekspresije in časovnih točk je tipično veliko manjše od števila opazovanih genov. Hkrati pa se pri izpeljavi gensko regulatornih omrežij iz podatkov genske ekspresije soočamo z manjkajočimi vrednostmi in podatki, ki pogosto vsebujejo tudi določene napake. Poleg tega s postopkom binarizacije časovnih vrst podatkov ekspresije genov vnašamo dodatno mero napak in nekonsistentnosti, pri čemer tvegamo izgubo izpeljave kompleksnejše dinamike. Izpeljava Boolovih opisov gensko regulatornih omrežij izključno iz binariziranih časovnih vrst genske ekspresije pogosto vodi do kompleksnih modelov, ki se pretirano prilegajo vhodnim podatkom (angl. overfitting). Da bi pridobili relevantnejše Boolove opise gensko regulatornih omrežij, bi lahko pri izpeljavi slednjih upoštevali različne vhodne podatke in predhodno znanje o pričakovanih topoloških lastnostih izpeljanega omrežja ali že znanih interakcijah. V pričujoči disertaciji zato razvijemo in opišemo inferenčno metodo SAILoR (angl. Structure-Aware Inference of Logic Rules). Predlagana metoda inkorporira zvezne in binarne podatke časovnih vrst genske ekspresije v kombinaciji s predhodnim znanjem, ki ga vpeljemo na osnovi poznavanja referenčnih omrežij za izpeljavo čim bolj natančnih in relevantnih Boolovih opisov gensko regulatornih omrežij opazovanega sistema. SAILoR iz referenčnih omrežij avtomatično izlušči določene topološke lastnosti. Referenčna omrežja so zato lahko bolj splošna in podajajo samo osnovno topološko strukturo, ali pa so bolj eksaktna in vsebujejo specifične interakcije. Metoda SAILoR tako navigira med dvema glavnima ciljema. To sta topološka podobnost z referenčnimi omrežji in ujemanje s podatki genske ekspresije. Z vključitvijo večkriterijskega genetskega algoritma NSGA-II se naša metoda poslužuje principa "modrosti množice" (angl. wisdom of the crowd), kjer hkrati izpeljujemo več omrežij in na koncu izberemo najprimernejšo. Naši rezultati nakazujejo, da je metoda SAILoR zmožna izpeljave biološko relevantnih Boolovih opisov tako iz strukturnega, kot tudi iz dinamičnega vidika. Z obsežnimi simulacijami in primerjavami pokažemo, da naša metoda izboljša pravilnost strukture relacij izpeljanih modelov glede na osnovno metodo dynGENIE3, pri čemer ohranja dinamično pravilnost. Hkrati našo metodo primerjamo z ostalimi pristopi za izpeljavo logičnih modelov kot so Best-Fit Extension, REVEAL, MIBNI, GABNI, ATEN in LogBTF. V delu pokažemo, da v primerjavi z ostalimi metodami, naša metoda izboljša strukturno pravilnost izpeljanih modelov, pri čemer takšni modeli ohranjajo dinamično točnost. Uporabo metode SAILoR dodatno demonstriramo na kontekstno specifičnem problemu gensko regulatornih podomrežij samičk vinske mušice D. melanogaster pred in po parjenju.

Language:Slovenian
Keywords:gensko regulatorna omrežja, Boolova logika, Boolovi opisi, inferenca logičnih modelov, večkriterijska optimizacija, genetski algoritmi, NSGA-II, dynGENIE3, triadni cenzus, strukturna pravilnost, dinamična pravilnost, biološko relevantni modeli, SAILoR
Work type:Doctoral dissertation
Typology:2.08 - Doctoral Dissertation
Organization:FRI - Faculty of Computer and Information Science
Year:2025
PID:20.500.12556/RUL-174675 This link opens in a new window
COBISS.SI-ID:253202179 This link opens in a new window
Publication date in RUL:08.10.2025
Views:171
Downloads:43
Metadata:XML DC-XML DC-RDF
:
Copy citation
Share:Bookmark and Share

Secondary language

Language:English
Title:Context-specific inference of Boolean descriptions of gene regulatory networks
Abstract:
Boolean networks provide an efficient and compact framework for modeling the interactions and dynamics of gene regulatory networks. However, inferring Boolean descriptions of these networks remains a challenging task. Gene expression datasets often contain significantly fewer experiments and time points than the number of genes in the regulatory network. Additionally, missing values and inherent noise in gene expression data further complicate the inference process. The binarization of gene expression data, while necessary for Boolean modeling, can lead to information loss and oversimplification of complex dynamics, resulting in erroneous or inconsistent data. Consequently, inferring Boolean models solely from binarized gene expression data often produces overfitted, complex models with low biological relevance. To obtain more biologically relevant Boolean descriptions of gene regulatory networks, we incorporate multiple data sources and prior knowledge, particularly regarding the expected topological structure and properties of the inferred networks. In this thesis, we present SAILoR (Structure-Aware Inference of Logic Rules), a novel inference method designed to improve the accuracy and robustness of Boolean network reconstruction. Our method integrates both continuous and binarized time-series gene expression data, combining them with prior knowledge in the form of reference networks to infer accurate and biologically relevant models of gene regulatory networks. SAILoR automatically extracts topological properties from these reference networks, which can either represent general structural expectations or specific interactions. By balancing two main objectives, topological similarity to the reference network and consistency with gene expression data, SAILoR effectively navigates the trade-offs in Boolean network inference. Utilizing the multi-objective genetic algorithm NSGA-II, our approach follows the wisdom of the crowds principle, simultaneously inferring multiple networks and selecting the best-performing one. Our results demonstrate that SAILoR can infer gene regulatory networks that are both structurally and dynamically accurate, enhancing their biological relevance. Through extensive simulations and comparisons with existing methods, we demonstrate that SAILoR enhances structural correctness compared to dynGENIE3 while preserving dynamic accuracy. Additionally, we compare our method to other Boolean inference approaches, including Best-Fit Extension, REVEAL, MIBNI, GABNI, ATEN, and LogBTF. Our results show that, compared to these methods, SAILoR produces models with improved structural accuracy while maintaining dynamic consistency. Furthermore, we apply SAILoR to infer context-specific gene regulatory subnetworks in female D. melanogaster before and after mating, demonstrating its applicability in real-world biological scenarios.

Keywords:gene regulatory networks, Boolean logic, Boolean descriptions, inference of Boolean models, multi-objective optimization, genetic algorithms, NSGA-II, dynGENIE3, triadic cenzus, structural correctness, dynamic accuracy, biologically relevant models, SAILoR

Similar documents

Similar works from RUL:
Similar works from other Slovenian collections:

Back