L2-penalizacija v linearnih mešanih modelih

Gerdej, Lan

Repository of the University of Ljubljana

Details

L2-penalizacija v linearnih mešanih modelih
ID Gerdej, Lan (Author), ID Blagus, Rok (Mentor) More about this mentor... This link opens in a new window

PDF - Presentation file, Download (6,28 MB)
MD5: 79C34137F37915162B781AF2804CD4D7

Abstract

V magistrskem delu obravnavamo L2-penalizacijo v linearnih mešanih modelih (LMM), s poudarkom na visokorazsežnih podatkih, kjer je število spremenljivk večje od števila opazovanj. Klasični pristopi za ocenjevanje parametrov LMM v takšnih pogojih odpovejo. V literaturi je L2-penalizacija (ridge regularizacija) ena izmed najpogosteje uporabljenih metod za obvladovanje preprileganja modelov. Njena implementacija v okviru mešanih modelov je omejena, ker večina obstoječih metod in programskih orodij ne podpira neposredne vključitve penalizacije, kar otežuje praktično uporabo ridge regularizacije pri mešanih modelih. V nalogi predstavimo nov pristop za uvedbo L2-penalizacije v LMM preko umetno generiranih psevdoopazovanj, ki za ocenjevanje penaliziranih LMM omogoča uporabo standardnih programskih orodij, kot sta lme4 in glmmTMB. Teoretično utemeljimo ekvivalentnost z Bayesovim pristopom ter izpeljemo konstrukcijo psevdoopazovanj, ki ustrezajo penalizacijskemu členu v logaritmu penaliziranega verjetja. Metodo ovrednotimo na simuliranih visokorazsežnih podatkih, kjer primerjamo napovedno uspešnost penaliziranih modelov pri različnih vrednostih penalizacijskega parametra λ. Rezultati kažejo, da predlagani pristop omogoča stabilne ocene parametrov tudi v visokorazsežnih primerih. Primerjamo tudi različne pristope izbire penalizacijskega parametra, vključno z navzkrižnim preverjanjem z izpustom posamezne gruče (angl. leave-one-cluster-out). Delo prispeva k razvoju metodologije za modeliranje koreliranih visokorazsežnih podatkov z uporabo linearnih mešanih modelov in odpira možnosti za nadaljnje raziskave v smeri drugih penalizacijskih pristopov in posplošenih mešanih modelov.

Language:	Slovenian
Keywords:	linearni mešani modeli, L2-penalizacija, ridge regularizacija, psevdoopazovanja, visokorazsežni podatki, regularizacija, navzkrižno preverjanje
Work type:	Master's thesis/paper
Typology:	2.09 - Master's Thesis
Organization:	FE - Faculty of Electrical Engineering
Year:	2025
PID:	20.500.12556/RUL-171747
COBISS.SI-ID:	256730115
Publication date in RUL:	01.09.2025
Views:	404
Downloads:	155
Metadata:
:	Copy citation
Share:

Secondary language

Abstract:
Language:	English
Title:	L2-penalization in linear mixed effects models
This thesis addresses the problem of L2-penalization in linear mixed models (LMM), with a focus on high-dimensional settings where the number of covariates exceeds the number of observations. Classical methods for parameter estimation fail under such conditions. In the literature, L2-penalization (ridge regularization) is one of the most widely used methods to control overfitting, but its implementation within mixed models is limited, since most existing approaches and software tools do not support direct inclusion of penalization, which hinders the practical application of ridge regularization in mixed models. We present a novel approach for introducing L2-penalization in LMM through artificially generated pseudo-observations, which enables estimation of penalized LMM using standard software tools such as lme4 and glmmTMB.We theoretically justify its equivalence to the Bayesian approach and derive the construction of pseudo-observations corresponding to the penalization term in the penalized log-likelihood. The method is evaluated on simulated high-dimensional data, where we compare the predictive performance of penalized models across different values of the penalization parameter λ. The results demonstrate that the proposed approach yields stable parameter estimates even in high-dimensional settings. We further compare different strategies for selecting the penalization parameter, including cross-validation with leave-one-cluster-out. This work contributes to the development of methodology for modeling correlated highdimensional data using linear mixed models and opens avenues for future research on other penalization approaches and generalized mixed models.
Keywords:	linear mixed models, L2-penalization, ridge regularization, pseudo-observations, high-dimensional data, regularization, cross-validation

Similar works from RUL:
Similar works from other Slovenian collections:

Details

Secondary language

Similar documents