izpis_h1_title_alt

Imputacija visokodimenzionalnih bioloških podatkov
ID Jelovčan, Gašper (Avtor), ID Curk, Tomaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,12 MB)
MD5: 088B3720A9A4B870C5EF9A1ACDEA8D7D

Izvleček
V diplomskem delu smo predstavili metode za imputacijo visokodimenzionalnih bioloških podatkov pridobljenih z metodami sekvenciranja posameznih celic. Pridobljenim podatkom mnogokrat manjkajo vrednosti, ki jih poskušamo nadomestiti z ocenami vrednosti. Preizkusili smo različne metode za imputacijo. Implementirali smo jih v modulu v programskem jeziku Python. Metode smo preverili na umetnih in pravih podatkih. Na preizkušenih podatkih so vse metode dosegle dobre rezultate. Najbolj ustrezna je bila metoda pCMF.

Jezik:Slovenski jezik
Ključne besede:Posamezne celice, števni podatki, redki podatki, imputacija.
Vrsta gradiva:Diplomsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2019
PID:20.500.12556/RUL-109866 Povezava se odpre v novem oknu
COBISS.SI-ID:1538319811 Povezava se odpre v novem oknu
Datum objave v RUL:09.09.2019
Število ogledov:1276
Število prenosov:214
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Imputation of high-dimensional biological data
Izvleček:
In this thesis we present methods for solving problems of high-dimensional biological data imputation collected by sequencing individual cells. We try to assign values to the missing data, replacing them with estimations. We tried several imputation methods. We have implemented imputation methods as a module in programming language Python. Then we tested them using synthetic data and real biological data. The evaluation showed that all methods achieve good results. The pCMF method performed the best.

Ključne besede:Single cell, count data, sparse data, imputation.

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj