Regresija ter gručenje sta pomembni komponenti strojnega učenja.
Prva služi kot pripomoček pri odkrivanju relacij med odvisnimi ter neodvisnimi spremenljivkami v podatkih.
S pomočjo druge metode podatke uredimo v skupine glede na njihove medsebojne podobnosti.
V našem delu predstavimo nov algoritem, ki hkrati opravlja obe nalogi.
Algoritem za neparametrično regresijo, ki temelji na Gaussovih mešanih modelih, v časovno odvisnih podatkih poišče gruče ter s pomočjo neparametrične regresije ustvari povprečne razvojne krivulje posameznih gruč.
V predstavljenem algoritmu neparametrična regresija temelji na regresiji z naravnimi kubičnimi zlepki.
Na začetku predstavimo teoretično ozadje predlaganega algoritma ter njegovih komponent.
Prav tako algoritmu zmanjšamo časovno kompleksnost s pomočjo različnih pohitritev.
Algoritem ter uporabljenje pohitritve smo implementirali v programskem jeziku Julia.
Njegovo delovanje evalviramo kvantitativno na umetni ter kvalitativno na resnični podatkovni zbirki Covid-19.
Cilj slednje evalvacije je gručenje podobnih držav glede na potek epidemije Covid-19 v posameznh državah.
|