Številne realne sisteme je moč modelirati z grafi ali omrežji. Eden glavnih ciljev modeliranja grafov je razvoj splošnih tehnik, ki so sposobne obdelovati strukturne podatke, vključujoč relacije med entitetami, ki pa so lahko obogatene tudi z domensko specifičnimi podatki. V doktorski disertaciji se ukvarjamo z učenjem predstavitve omrežij, katere cilj je samodejno učenje nizkorazsežnih vektorskih značilk oziroma vložitev za najpreprostejše motive grafov, kot so vozlišča in povezave. S tem iščemo način, ki bi omogočil učinkovito reševanje problemov strojnega učenja na grafih, kar vključuje klasifikacijo vozlišč, napovedovanje povezav, razvrščanje vozlišč v skupine in vizualizacijo grafov.
Pričnemo s primerjavo operatorjev za vložitve parov vozlišč, temelječ na obstoječih pristopih vložitve posameznih vozlišč z namenom učinkovitega reševanja problema napovedovanja povezav. Predlagamo več omejitev vložitve parov vozlišč glede na njihovo lokalno okolico in potrdimo svoje ugotovitve preko različnih eksperimentov napovedovanja povezav za primer klasifikacije in regresije. Rezultate binarne klasifikacije manjkajočih povezav v omrežjih soavtorstev tolmačimo kot priporočilni sistem za znanstveno sodelovanje nad resničnim naborom podatkov iz Univerze HSE.
Z uporabo ideje o sočasni vložitvi vozlišč in povezav razvijemo nove pristope vložitve vozlišč in povezav pod skupnimi omejitvami nad grafom in z njim povezanim povezavnim grafom. Model vključuje dva samokodirnika za graf in njegov povezavni graf z dodano gradnjo strukturnih značilk, Laplaceovo regularizacijo in učenjem modela z uporabo $\beta$-maskiranja. Glavna značilnost modela je v skupnih omejitvah vložitve vozlišč in povezav v grafu in njegovem povezavnem grafu, s čimer model preseže uspešnost obstoječih pristopov klasifikacije vozlišč in napovedovanja povezav pri nenadzorovanem in delno-nadzorovanem učenju.
Sledeč razmahu raziskav na področju učenja omrežnih predstavitev, disertacija poda obsežen pregled obstoječih pristopov vložitve omrežij preko različnih dimenzij, kot so različne tehnike gradnje modelov, vrste omrežnih podatkov, praktične aplikacije in primeri uporabe ter odprti problemi pri učenju omrežnih predstavitev. Pregled področja vključuje tudi primerjavo uspešnosti najsodobnejših pristopov na resničnih omrežjih in naključnih grafih. Slednje je v pomoč pri izbiri ustreznega modela za klasifikacijo vozlišč, napovedovanje povezav, razvrščanje vozlišč ali vizualizacijo izbranih omrežnih podatkov.
Eno izmed odprtih vprašanj pri učenju omrežnih predstavitev predstavljajo omrežja s pripisanimi poljubnimi podatki o vozliščih. V disertaciji se osredotočimo na primer omrežij s pripisanimi besedilnimi podatki in podamo poglobljeno analizo modelov za združeno vložitev besedil in omrežij na različnih naborih podatkov klasifikacije vozlišč, napovedovanja povezav in vizualizacije grafov. Kljub temu da ne obstaja en združen model, ki bi presegel vse ostale, pa je moč izbrati preprost model, združujoč besedilne in omrežne podatke, ki je vsaj tako uspešen kot sodobni modeli grafovskih nevronskih mrež.
Disertacija naslavlja hitro razvijajoče se področje učenja predstavitve omrežnih podatkov in podaja enotno primerjavo uspešnosti sodobnih modelov omrežne predstavitve. Predlagamo različne nove modele omrežne predstavitve in delno odgovorimo na vprašanje, kateri modeli so uspešnejši pri izbranih kriterijih učenja in vrsti omrežnih podatkov. Poleg tega predstavimo različne primere uporabe vložitve omrežnih podatkov v strojnem učenju, priporočilnih sistemih in združevanju podatkov.
|