Detekcija objektov je priljubljena tematika na področjih računalniškega vida in strojnega učenja. Reševanje problemov detekcije objektov predstavlja precejšenj izziv in v literaturi obstaja veliko različnih pristopov. Pristopi se konceptualno precej razlikujejo, različne pa so tudi njihove časovne zahtevnosti.
Cilj diplomske naloge je ustvariti splošen pristop za zaznavanje objektov v sliki, v našem primeru polipe meduze Aurelia aurita. Za te polipe je značilno, da se na gosto širijo preko koral. Ena od značilnih tematik pri detekciji objektov je iskanje določenih regij v sliki, ki nas zanimajo. Ponavadi iščemo regije različnih velikosti. Zato smo predlagali uporabo modela agregirane značilnice po kanalih (ACF), ki se je učil na anotaciji iz naše zbirke. Iz vsake regije moramo izluščiti podatke, na podlagi katerih posamezni regiji določimo lastnosti ali karakteristike. V tej diplomski nalogi smo to izvedli s pomočjo konvolucijske nevronske mreže (CNN), ki je bila trenirana na podatkovni zbirki MNIST. Poleg tega sta za klasifikacijo in ocenjevanje njene pravilnosti uporabljena binarni klasifikator podpornih vektorjev (SVM) z linearnim jedrom ter L2 regularizirana logistična regresija. Zelo verjetno je, da vsaki anotaciji pripada več regij, ki jih ACF predlaga. Zato je potrebno veliko teh regij odstraniti s pomočjo metode tlačenja nemaksimumov, ki se naivno osredotoča na tiste regije, ki imajo višje ocene. Algoritme, ki smo jih uporabljali, so bili učeni in preizkušeni na novi zbirki podatkov, ki je sestavljena iz skoraj 40000 pravokotnih anotacij v 35 slik. Dosegli smo zelo obetavne rezultate ter analizirali prednosti in slabosti našega pristopa.
|