Glavni cilj naloge je bil olajšati problem pomanjkanja podatkov pri analizi podatkov in v strojnem učenju. Razvili smo generator delno umetnih podatkov na podlagi samokodirnikov. Implementirali smo dinamične samokodirnike brez vnaprej določene strukture, saj smo želeli, da so generatorji uporabni na poljubni učni množici. Rezultati so pokazali, da generatorji na podlagi samokodirnikov delujejo bolje kot variacijski samokodirniki. Naši generatorji najbolje delujejo na podatkovnih množicah z manjšim številom atributov in z uravnoteženimi razredi. Večje število učnih primerov izboljša delovanje generatorjev. Rezultati so tudi pokazali, da z mrežnim iskanjem znatno izboljšamo rezultate in da je možno napovedati dobre parametre glede na karakteristike dane podatkovne množice.
|