Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Večciljno učenje v klasifikaciji in regresiji
ID
Čepin, Gregor
(
Avtor
),
ID
Robnik Šikonja, Marko
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(453,51 KB)
MD5: A1333BD493C70C66589CB8C25E1F59AD
PID:
20.500.12556/rul/40d3fe64-d54f-472c-a7fc-6c1d0e23ad9e
Galerija slik
Izvleček
Večciljno učenje je metoda strojnega učenja, pri kateri je cilj, da se algoritem obenem nauči reševati več sorodnih problemov. Namesto več ločenih modelov poišče algoritem skupen model, ki je tipično manjši od vsote velikosti posameznih modelov, je lažje razumljiv in manj prilagojen učnim podatkom. Pri napovedovanju s skupnim modelom algoritem napoveduje vrednosti za več problemov hkrati. Uporabljeni problemi morajo biti med seboj sorodni, da lahko učenje enega problema pripomore k boljšemu učenju ostalih problemov. Do sedaj je bil pristop pri drevesnih metodah uspešno uporabljan za združevanje več klasifikacijskih ali več regresijskih problemov, v tem delu pa pristop posplošimo tako, da lahko uporabljamo klasifikacijske in regresijske naloge mešano. Pri gradnji drevesnih modelov uporabljata klasifikacija in regresija različne metode za izbiro atributov pri delitvi primerov v notranjih vozliščih. Vrednosti ocen med seboj niso primerljive, zato pri gradnji drevesa atribute rangiramo glede na obe metodi in izberemo atribut, ki je skupno najbolje rangiran. V nalogi implementiramo večciljno odločitveno in regresijsko drevo ter ansambelski metodi večciljni bagging in večciljni naključni gozd. Primerjamo jih z enociljnimi različicami algoritmov, z običajnimi večciljnimi drevesi in z večciljnimi nevronskimi mrežami. Uvedemo mero sorodnosti med nalogami, ki temelji na rangiranju atributov. Ta nam omogoča, da znotraj podatkovne množice poiščemo tiste naloge, ki so si najbolj sorodne in jih je smiselno obravnavati z večciljnim pristopom. Na eni od podatkovnih množic deluje implementirani večciljni naključni gozd statistično značilno bolje kot enociljni algoritmi. Na nekaterih podatkovnih množicah pa implementirani algoritmi delujejo slabše kot enociljni.
Jezik:
Slovenski jezik
Ključne besede:
strojno učenje
,
odločitveno drevo
,
večciljno učenje
,
naključni gozd
,
bagging
,
klasifikacija
,
regresija
,
rangiranje
Vrsta gradiva:
Magistrsko delo/naloga
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2016
PID:
20.500.12556/RUL-81190
Datum objave v RUL:
31.03.2016
Število ogledov:
2621
Število prenosov:
548
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
ČEPIN, Gregor, 2016,
Večciljno učenje v klasifikaciji in regresiji
[na spletu]. Magistrsko delo. [Dostopano 1 maj 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=81190
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Multitask learning in classification and regression
Izvleček:
Multitask learning is an approach to machine learning, in which algorithm learns to solve multiple related problems. It tries to find one common model instead of building multiple separate models. Such a model is usually smaller than the sum of separate models, easier to understand and less likely to overfit training data. In prediction stage the algorithm predicts values for several problems at the same time. Problems that are learned together must be related, so that learning of one problem can improve learning of other problems. Currently this approach is used with tree models for either multiple classification or multiple regression tasks. In this work we extend the approach to mixed classification and regression tasks. During construction of trees different attribute selection methods are used in regression and classification. The returned scores are not directly comparable, so in our scenario we rank attributes for each task and choose the attribute that is best ranked in total. We implement multitask regression and classification tree, multitask bagging and multitask random forest based on rankings of attributes. We compare these algorithms with their single task variants, with regular multitask tree and with multitask neural network. We propose task relatedness measure based on ranking of attributes. In this way we can find related tasks in a dataset and use them together in multitask approach. On one dataset implemented multitask random forest works statistically significantly better than single-task version. On some datasets implemented algorithms work worse than single-task versions.
Ključne besede:
machine learning
,
decision tree
,
multitask tree
,
random forest
,
bagging
,
classification
,
regression
,
ranking
Podobna dela
Podobna dela v RUL:
Ocena uspešnosti spletne intervencije za zmanjšanje pitja alkohola
Uporabnost EURO-URHIS metodologije za ugotavljanje razlik v zdravju znotraj urbanega okolja Slovenije
Dejavniki uspešnosti telemedicine na primeru zdravstvenih storitev na daljavo
Povezanost biopsihosocialnega pristopa k zdravljenju s kakovostjo oskrbe bolnikov
Duševno zdravje mladih v Savinjski regiji
Podobna dela v drugih slovenskih zbirkah:
Reply by authors
Indikatorji duševnega zdravja pri zaprtih osebah
COVID-19
Dejavniki tveganja za pojav samomorilnosti
Mednarodni odnosi v zdravstvu-dostopnost do zdravstvenih storitev v EU
Nazaj