Hierarhični adaptivni model za robustno kratkoročno vizualno sledenjeČehovin Zajc, Luka (Avtor)
Leonardis, Aleš (Mentor)
Kristan, Matej (Komentor)
računalniški vidvizualno sledenjevizualni modelkratkoročno sledenjeartikulirani objektine-togi objektimere performansocenjevanje performansrangiranjeVizualno sledenje je področje v okviru računalniškega vida, katerega rezultate je mogoče uporabiti na mnogih, tako novih kot tudi že uveljavljenih, področjih, kot so npr. robotika, video-nadzorni sistemi, interakcija med človekom in računalnikom, avtonomna vozila ter analiza športa. Glavno vprašanje vizualnega sledenja je razvoj algoritmov (sledilnikov), ki določajo stanja enega ali več objektov v toku slik ob upoštevanju časovne soslednosti le-teh. V tej doktorski disertaciji naslavljamo dve raziskovalni temi iz področja kratkoročnega vizualnega sledenja. Prvi sklop predstavljenih raziskav naslavlja konstrukcijo vizualnega modela, ki ga sledilnik uporablja za opis izgleda objekta. Vprašanje modeliranja ter osveževanje vizualnega modela je eno izmed ključnih vprašanj vizualnega sledenja. V okviru dela najprej predstavimo hierarhični vizualni model, ki izgled strukturira v več plasti. Najnižja plast vsebuje najbolj specifične informacije o izgledu, višje plasti pa opisujejo izgled v bolj posplošeni obliki. Hierarhična urejenost se odraža tudi v posodabljanju vizualnega modela, kjer višje plasti vodijo posodabljanje nižjih plasti, le-te pa v primeru lastne zanesljivosti služijo kot vir informacij za osveževanje višjih plasti. Koristi hierarhičnega modela sta predstavljeni z dvema implementacijama, ki sta primarno namenjeni sledenju netogih in artikuliranih objektov, kot tiste kategorije objektov, ki predstavlja velik problem za marsikateri vizualni sledilnik. Prvi predlagani model združuje lokalno in globalno predstavitev izgleda v sklopljenem vizualnem modelu. Spodnja plast je sestavljena iz več med seboj povezanih delov, ki so se sposobni prilagajati geometrijskim spremembam netogih objektov, zgornja plast pa vsebuje večmodalno globalno predstavitev izgleda, ki vodi proces posodobitve spodnje plasti. V okviru eksperimentalne analize smo pokazali, da se tak sklopljeni model izgleda izkaže v robustnosti, klub dejstvu, da smo za opis izgleda uporabili sorazmerno preproste opisnike. Analiza razkrije tudi nekaj pomanjkljivosti modela, ki se kažejo v znižani natančnosti sledenja. Zato naš drugi predstavljeni model razširja hierarhijo s tretjo plastjo in konceptom sidrnih predlog. Prvi dve plasti drugega vizualnega modela sta konceptualno zelo podobni osnovnemu sklopljenemu vizualnemu modelu, tretja plast pa vsebuje spominski sistem statičnih predlog, ki vizualnemu modelu nudijo močno informacijo o položaju in velikosti objekta v primeru dobrega ujemanja ene izmed predlog s sliko. Na ta način tretja plast pripomore k hitremu okrevanju celotnega vizualnega modela. Predstavljena eksperimentalna analiza koristi tretje plasti potrdi, saj sledilnik s tem modelom izgleda izboljša natančnost, pa tudi splošno kvaliteto sledenja.
Drugo vprašanje, ki ga naslavljamo v tej doktorski disertaciji, je ocenjevanje performans kartkoročnih sledilnikov. V nasprotju s prevladujočimi trendi v zadnjih desetletjih trdimo, da je vizualno sledenje kompleksen proces, katerega lastnosti ni mogoče opisati z eno samo mero uspešnosti, po drugi strani pa tudi ne smemo uporabiti poljubne množice mer, za katere ne poznamo medsebojnih odnosov. V naši raziskavi smo zato pregledali in analizirali pogosto uporabljene mere performans in pokazali, da nekatere izmed njih merijo iste kvalitete ali pa so celo teoretično ekvivalentne. Na temelju te analize smo predlagali par dveh šibko koreliranih mer, ki odražata natančnost in robustnost sledilnega algoritma, ustrezen prikaz takih rezultatov ter analizo celotne metodologije s pomočjo predlaganih teoretičnih sledilnikov, ki izražajo ekstremno obnašanje sledilnih algoritmov. Vse to smo nadgradili še z metodologijo rangiranja večjega števila sledilnikov, ki upošteva morebitno stohastično naravo sledilnikov ter preveri statistično značilnost razlike med njihovimi rezultati. Celotno metodologijo smo implementirali v odprtokodnem programskem orodju, razvili pa smo tudi preprost komunikacijski protokol, ki omogoča preprosto integracijo obstoječih implementacij sledilnikov v sistem. Z uporabo razvitega orodja se predlagana metodologija sedaj uporablja tudi v okviru Visual Object Tracking (VOT) challenge delavnic in tekmovanj.20152015-09-29 05:11:37Doktorsko delo/naloga72632COBISS_ID: 1536554691sl