Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Razpoznavanje hrane na podlagi slik z nevronskimi mrežami
ID
Sedevcic, Kevin
(
Avtor
),
ID
Kristan, Matej
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(2,30 MB)
MD5: A0793367EA5EC8DDE637611097C569C6
PID:
20.500.12556/rul/5903a600-8980-480b-8b16-c5de026085dc
Galerija slik
Izvleček
V magistrski nalogi naslavljamo problem klasifikacije slik in sestave opisov slik s tremi implementiranimi metodami z nevronskimi mrežami (klasifikacija hrane, sestava opisov hrane in sestava opisov hrane z regijami), ki so bile učene in testirane na dveh podatkovnih zbirkah. Prva razdeljena na 21 kategorij hrane z 1470 slikami in druga, podatkovna zbirka opisov (2 kategoriji in 5 opisnih stavkov na sliko). Prva implementirana metoda—metoda klasifikacije hrane—uporablja arhitekturo GoogLeNet-Inception-v3 mreže (že učena na zbirki ILSVRC), ki je bila dodatno učena na naši podatkovni zbirki hrane na kateri dosega 82.4% top-1 in 98% top-5 točnosti. Druga metoda—metoda sestave opisov—uporablja arhitekturo Show and Tell mreže, ki je inicializirana z našim modelom klasifikacije hrane in doseže 23.3 točk perpleksnosti. Metoda ne sestavi popolnih opisov slik, ko sta prisotna dva ali več objekta na sliki, zato smo implementirali še metodo, ki bi izpisala vsebovanost objektov v slikah. Tretja metoda—metoda za sestavo opisov slik z regijami—uporablja isti vizualni model, ki je uporabljen v prejšnjih dveh metodah a z razliko, da klasificira regije vhodne slike. Rezultat evaluacije nad isto podatkovno zbirko je 86.5% top-1 točnosti. Dodatna evaluacija, ki testira količino razpoznanih objektov v slikah z več različnimi objekti hrane je dokazala da metoda razpozna 64% objektov na slikah.
Jezik:
Angleški jezik
Ključne besede:
računalniški vid
,
računalništvo
,
strojno učenje
Vrsta gradiva:
Magistrsko delo/naloga
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2017
PID:
20.500.12556/RUL-98939
Datum objave v RUL:
14.12.2017
Število ogledov:
2443
Število prenosov:
402
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
SEDEVCIC, Kevin, 2017,
Razpoznavanje hrane na podlagi slik z nevronskimi mrežami
[na spletu]. Magistrsko delo. [Dostopano 29 marec 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=98939
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Slovenski jezik
Naslov:
Image-based food recognition using neural networks
Izvleček:
In this thesis we address the problems of image classification and image captioning with three implemented methods with neural networks (food classification, food captioning and food captioning by region-proposal). The methods were trained and tested on a 21-category food image dataset with 1470 images and a 2-category food caption dataset with 750 caption sentences. The first method—food classification method—uses the architecture of the GoogLeNet-Inception-v3 model trained on our food dataset, achieving a top-1 prediction accuracy of 82.4% and top-5 prediction accuracy of 98%. The second method—food captioning method—uses the Show and Tell architecture trained on our food caption dataset, achieving a perplexity score of 23.3. Our food visual model was used to classify the input images, but the overall results did not meet expectations, as the model does not correctly caption images containing multiple foods. The third method—food captioning with region proposal—uses our food classification method to classify images and performs better than the food-classification method alone, achieving a prediction accuracy of 86.5%. Additionally, this third method summarizes the contents of images containing different types of food with an accuracy score of 64%.
Ključne besede:
computer vision
,
computer science
,
machine learning
Podobna dela
Podobna dela v RUL:
Razvoj ekstrakcijske metode za določanje benzotriazolov v tleh
Preizkus ekstrakcije benzotriazolov iz tal z uporabo vroče vode
Optimizacija ekstrakcije alkilfenolov iz vodnih vzorcev
Določitev fitoestrogenov v pivu s HPLC
Določanje tokoferolov v oljih s HPLC
Podobna dela v drugih slovenskih zbirkah:
Primerjava lastnosti HPLC kolon polnjenih z različnimi nosilci
Določanje glutaminske kisline v prehrambenih izdelkih s tekočinsko kromatografijo
Razvoj HPLC analizne metode za določanje sproščanja zdravilnih učinkovin iz medicinskih oblog ob sočasnem upoštevanju erozije nosilnega materiala
Nazaj