V središču te diplomske naloge je statistična obravnava podatkovij z manjkajočimi podatki zaradi meje zaznavnosti. Motivacija izhaja iz sekundarne analize podatkov raziskave KARISMA, ki preučuje vpliv različnih odmerkov tamoksifena na koncentracije hormonov v krvi. Opisani in primerjani so pogosto uporabljeni pristopi za obravnavo vrednosti pod mejo zaznavnosti v linearni regresiji, vključno z nadomeščanjem vrednosti, analizo popolnih primerov, indikatorji manjkajočnosti, Tobit regresijo, modelom pospešenega časa do dogodka ter enokratno in večkratno imputacijo. Metode so primerjane na simuliranih podatkih ob predpostavki log-normalne porazdelitve, pri čemer približno polovica vrednosti pade pod mejo zaznavnosti v neodvisnih in/ali odvisnih spremenljivkah. Metode, primerne za scenarij, v katerem tako neodvisna kot odvisna spremenljivka vsebujeta vrednosti pod mejo zaznavnosti, so nato uporabljene na podatkih o koncentraciji estradiola v krvi iz raziskave KARISMA, da bi ocenili, kako izbira metode vpliva na ocenjene učinke v realnem okolju. Rezultati kažejo, da model pospešenega časa do dogodka in Tobit model presegata nadomeščanje vrednosti in analizo popolnih primerov, kadar ima odvisna spremenljivka vrednosti pod mejo zaznavnosti. Pri neodvisni spremenljivki z vrednostmi pod mejo zaznavnosti pristop z indikatorjem manjkajočnosti predstavlja kompromis med pristranskostjo in učinkovitostjo, čeprav je analiza popolnih primerov manj pristranska. Kadar podatki manjkajo tako pri neodvisni kot pri odvisni spremenljivki, tako kombiniran pristop daje najboljše rezultate.
|