20.500.12556/RUL-116157
Podatkovna zbirka redkih realističnih slikovnih anomalij za testiranje generativnih globokih nevronskih mrež
A Database of Rare Realistic Imaging Anomalies for Testing Generative Deep Neural Networks
V delu se osredotočamo na podatkovne zbirke z anomalijami, ki se uporabljajo za učenje in testiranje nevronskih mrež ali drugih metod strojnega učenja. V takih bazah so podatki razdeljeni v kategoriji normalnih in abnormalnih podatkov. V 1. kategorijo spadajo vsi podatki, za katere imamo na voljo dovolj znanja, znamo jih modelirati in predstavljajo večinski del baze. Pridobivanje teh podatkov je v primerjavi z anomalijami enostavno. V kategorijo abnormalnih podatkov pa sodijo anomalije - podatki, o katerih imamo pomanjkljivo znanje, pojavljajo se redko, pogosto vseh oblik anomalij niti ne poznamo. Zato se v teh primerih uporabljajo generativne nevronske mreže, ki za učenje uporabljajo samo navadne podatke. Zaradi težav pri definiranju abnormalnosti in pridobivanju takih podatkov, je število kakovostnih zbirk z anomalijami veliko manjše od podatkovnih zbirk, kjer so posamezne kategorije podatkov enakomerno zastopane.
V tem delu smo tako pripravili novo podatkovno zbirko, ki je izrazito neuravnotežena, abnormalnih podatkov je v primerjavi z normalnimi podatki izjemno malo. Bazo sestavljajo majhne slike zemeljskega površja, ki smo jih dobili iz satelitskih slik, kot anomalije pa so določene slike letal. Pozicije letal na slikah smo dobili s polavtomatsko metodo označevanja, pomagali smo si z ADS-B podatki.
Na koncu smo pridobljeno bazo uporabili za testiranje generativne nevronske mreže GANomaly, ki je namenjena detekciji anomalij. Zanimalo nas je, kako razmerje navadnih in abnormalnih podatkov vpliva na rezultate.
The focus of this work are anomalous datasets used for training and evaluation of neural networks or other machine learning algorithms. Data in an anomalous dataset can be categorized into normal and abnormal data. The first category represents the majority of the dataset and includes all data that is well defined, can be modeled well and is also easy to acquire compared to abnormal data. On the other hand we have limited knowledge about the data in the second category which contains anomalous data, with many types of anomalies not being known in advance. For these reasons we use generative neural networks on such tasks and train them using only normal data. Due to many difficulties in defining and acquiring anomalous data, relatively few datasets exist in the literature compared to datasets where all categories of data are well defined and represented equally.
In this thesis we created a dataset that is extremely imbalanced, containing much less abnormal data then normal data. The dataset consists of small patches of satellite images, with images of planes being labeled as anomalies. The process of labeling data was semi-supervised and we used ADS-B data to get airplane positions in the satellite images.
In the end we used the new dataset to evaluate a generative neural network GANomaly, which was presented for the purpose of anomaly detection, and examined how different ratio of normal and abnormal examples affects the performance of the network.
anomalija
podatkovna zbirka
računalniški vid
detekcija anomalij
ADS-B
GAN
GANomaly
anomaly
dataset
computer vision
anomaly detection
ADS-B
GAN
GANomaly
true
false
false
Slovenski jezik
Angleški jezik
Magistrsko delo/naloga
2020-05-19 15:20:01
2020-05-19 15:20:10
2022-08-28 03:47:26
0000-00-00 00:00:00
2020
0
0
0000-00-00
NiDoloceno
NiDoloceno
NiDoloceno
0000-00-00
0000-00-00
0000-00-00
1970-01-01
50041
Kastelic_Marko_-_Podatkovna_zbirka_redkih_realisticnih_slikovnih_anomalij_za_testiranje_generati.pdf
Kastelic_Marko_-_Podatkovna_zbirka_redkih_realisticnih_slikovnih_anomalij_za_testiranje_generati.pdf
1
67859D8163CEC7E85609F3C08CC57AEE
5fb148003e81803bec048f2bf743b8437a6c21431c18101c6adb60e77d07fef0
d396f7af-a1b8-11eb-a523-00155dcfd717
https://repozitorij.uni-lj.si/Dokument.php?lang=slv&id=129567
Fakulteta za elektrotehniko
0
0
0