Dosedanje raziskovanje vizualnega sledenja predmetom je bilo osredotočeno predvsem na sledenje neprosojnim objektom, medtem pa je raziskav, ki se osredotočajo na prosojne objekte, izjemno malo. Ker so prosojni objekti unikatni po izgledu glede na njihovo ozadje, je bila pred kratkim ustvarjena evalvacijska podatkovna zbirka ravno zaradi tega. V tej magistrski nalogi smo želeli prispevati k razvoju omenjenega področja tako, da smo ustvarili učni podatkovni zbirki imenovani Trans2k in Trans1k, ki skupno vsebujeta 156.143 slik v več kot tri tisoč posnetkih in sta označeni s segmentacijskimi maskami in očrtanimi pravokotniki.
Ob upoštevanju, da je mogoče prosojne predmete realistično upodobiti s sodobnimi izrisovalniki, smo kvantificirali domensko specifične lastnosti in izrisali nabor podatkov, ki vsebuje želene vizualne lastnosti prosojnih objektov ter želeno gibanje, ki ni bilo zajeto v obstoječih naborih podatkov za sledenje neprosojnim objektom. Ugotovili smo konsistentno povečanje zmogljivosti (do 16 %) v raznolikem naboru sodobnih sledilnih arhitektur ob uporabi podatkovne zbirke Trans2k, s čimer smo pridobili vpoglede, ki prej niso bili mogoči zaradi pomanjkanja primernih podatkovnih zbirk. Poleg tega smo predlagali novo sledilno arhitekturo DiETTO, ki dosega najboljše rezultate na nedavni evalvacijski podatkovni zbirki. Učni podatkovni zbirki, izrisovalnik in DiETTO bodo javno objavljeni z namenom omogočanja razvoja sodobnih sledilnikov, ki temeljijo na učenju, in spodbujanja nove zasnove pri sledenju prosojnim objektom.
|