Matrična faktorizacija se je izkazala kot uporabna in zanesljiva metoda za implementacijo
obsežnih aplikacij strojnega učenja, kot so na primer priporočilni sistemi. Težave z
redkostjo podatkov in problem hladnega zagona se lahko posredno omilijo z uporabo
več heterogenih virov podatkov, hkrati pa uspešna uporaba zlivanja podatkov doprinaša
večjo napovedno točnost. Za vsakodnevne aplikacije, na primer take s stalnimi povratnimi
informacijami uporabnikov, ostaja inkrementalno posodabljanje modelov, naučenih
na več podatkovnih tokovih, ključen in le delno rešen problem.
V delu predlagamo metodo za zlivanje več podatkovnih tokov z uporabo matrične
faktorizacije. Predlagana metoda modelira heterogene in nesočasne podatkovne tokove
in omogoča napovedovanje v realnem času. Zaradi inkrementalnega posodabljanja se
predlagana metoda uspešno prilagaja spremembam v podatkovnih konceptih, hkrati pa
uspešno zlivanje podatkov izboljša točnost napovedi in zmanjša negativne učinke hladnega
zagona. Kot primer uporabe naše predlagane metode izdelamo priporočilni sistem in
pokažemo, da se točnost priporočanja bistveno poveča z upoštevanjem več podatkovnih
virov hkrati. Vendarle pa je evalvacija algoritmov za podatkovno zlivanje, priporočanje
in inkrementalnega učenja, ki jih uporablja tudi naša metoda, težka, predvsem zaradi
pomanjkanja dostopnih podatkovnih virov. Za reševanje tega problema v disertaciji predlagamo
sintetični generator podatkov. Ta lahko generira več časovno in medsebojno
odvisnih podatkovnih tokov z relacijskimi podatki. Podatkovni tokovi, ustvarjeni na
ta način, uspešno posnemajo realne množice podatkov v smislu statističnih lastnosti in
primerljive uspešnosti napovednih modelov strojnega učenja.
Predlagana metodologija ponuja pomoč pri razvoju algoritmov za sočasno modeliranje
podatkovnih tokov v realnem času. Poleg priporočilnih sistemov pa vsestranskost
matrične faktorizacije omogoča njeno uporabnost za reševanje številnih drugih problemov
strojnega učenja, kot so zmanjševanje dimenzionalnosti, gručenje in klasifikacija.
|