izpis_h1_title_alt

Uporaba globokega učenja za detekcijo objektov na fotografijah turističnih nastanitev
ID NOVAK, GREGOR (Avtor), ID Curk, Tomaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,54 MB)
MD5: AA7B98509A748F68CA631748635C316E

Izvleček
V diplomski nalogi smo poskusili rešiti problem izbire najprimernejših modelov detekcije objektov z metodami globokega učenja za uporabo na fotografijah, značilnih za oglase turističnih nastanitev. Pri tem smo za referenčno množico fotografij turističnih nastanitev uporabili fotografije iz spletnih oglasov. Osredotočili smo se na oglase nastanitev iz dveh priljubljenih slovenskih turističnih destinacij, Kranjske Gore in Pirana. Uporabili smo več vnaprej naučenih modelov, ki kot rezultat svoje detekcije vračajo mejne škatle objektov. Šest uporabljenih modelov je bilo učenih na množici fotografij COCO, dva modela pa sta bila učena na množici Open Images. Modele smo primerjali glede na rezultate detekcije na fotografijah turističnih nastanitev, na delu testne množice Open Images pa smo poskusili ovrednotiti tudi njihovo uspešnost. Predstavimo tudi nov način uporabe obstoječih modelov, združevanje v sistem več modelov. Glede na pridobljene rezultate, kot najbolj primeren nabor izmed uporabljenih modelov, predlagamo združen sistem modelov, kjer uporabimo modela R-FCN in YOLOv3, učena na množici COCO, v kombinaciji z modelom Faster R-CNN, učenim na množici Open Images.

Jezik:Slovenski jezik
Ključne besede:globoko učenje, strojno učenje, prepoznavanje objektov, detekcija objektov
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2020
PID:20.500.12556/RUL-120072 Povezava se odpre v novem oknu
COBISS.SI-ID:31345155 Povezava se odpre v novem oknu
Datum objave v RUL:15.09.2020
Število ogledov:1321
Število prenosov:157
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Deep learning for object detection in photographs of tourist accommodations
Izvleček:
In this diploma thesis, we address the problem of choosing the most appropriate group of deep learning object detection models for use on photographs, which are typical for tourist accommodations. As a representative dataset for this domain of photographs, we used photographs from online listings. We focused on two popular Slovenian destinations, Kranjska Gora and Piran. We used several pre-trained models, which return bounding boxes for detected objects. Out of eight models in total, six object detection models were trained on COCO dataset, and two models were trained on Open Images dataset. We compared the models according to their performance on photographs from tourist accommodation online advertisements. We also tried evaluating their performance on part of the test dataset from Open Images. Additionally, we present a new way of using existing object detection models, i.e., merging multiple models into a combined system. As a final solution to our given problem, we propose a merged system of models R-FCN and YOLOv3, which were trained on the COCO dataset, in combination with the model Faster R-CNN that was trained on the Open Images dataset.

Ključne besede:deep learning, machine learning, object recognition, object detection

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj