Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Avtomatsko podnaslavljanje slik z globokimi nevronskimi mrežami
ID
BAUMKIRHER, URBAN
(
Avtor
),
ID
Robnik Šikonja, Marko
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(5,18 MB)
MD5: 6EA2875D724F882A9A50FD389F231080
PID:
20.500.12556/rul/a442de34-1f47-449f-9796-a4375aab932a
Galerija slik
Izvleček
V diplomskem delu smo implementirali globoko nevronsko mrežo, ki smo jo naučili generirati stavčni opis slike. Mreža povezuje področje računalniškega vida in obdelave naravnega jezika. Sledili smo že objavljenim arhitekturam in arhitekturo implementirali s knjižnico Keras v jeziku Python. Podatke smo pridobili s spletne podatkovne zbirke MS COCO iz leta 2014. Naša rešitev implementira dvodelni model in uporablja globoke konvolucijske, rekurenčne in polno povezane nevronske mreže. Za obdelavo in zajem značilk slik smo uporabili arhitekturo VGG16. Besede smo predstavili z vektorsko vložitvijo GloVe. Model smo naučili na podatkovni zbirki 82.783 slik in testirali s 40.504 slikami ter opisi. Ocenili smo ga z mero BLEU in dosegli vrednost 49.0 ter klasifikacijsko točnost 60 %. Najboljših objavljenih rezultatov nismo dosegli, a obstaja še veliko možnosti za izboljšave.
Jezik:
Slovenski jezik
Ključne besede:
opisovanje slik
,
označevanje slik
,
strojno učenje
,
globoko učenje
,
nevronske mreže
,
konvolucijske nevronske mreže
,
rekurenčne nevronske mreže
,
LSTM mreže
Vrsta gradiva:
Diplomsko delo/naloga
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2017
PID:
20.500.12556/RUL-94485
Datum objave v RUL:
31.08.2017
Število ogledov:
5035
Število prenosov:
656
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
BAUMKIRHER, URBAN, 2017,
Avtomatsko podnaslavljanje slik z globokimi nevronskimi mrežami
[na spletu]. Diplomsko delo. [Dostopano 2 april 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=94485
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Automatic image captioning using deep neural networks
Izvleček:
We implemented a deep neural network, which we trained to generate image captions. The neural network connects computer vision and natural language processing. We followed existing architectures for the same problem and implemented our architecture with Keras library in Python. We retrieved data from an online data collection MS COCO. Our solution implements a bimodal architecture and uses deep convolutional, recurrent and fully connected neural networks. For processing and collecting image features we used the VGG16 architecture. We used GloVe embeddings for word representation. The final model was trained on a collection of 82.783 and tested on 40.504 images and their descriptions. We evaluated the model with the BLEU score metric and obtained a value of 49.0 and classification accuracy of 60 %. Current state-of-the-art models were not surpassed, but we see many possibilities for improvements.
Ključne besede:
image captioning
,
machine learning
,
deep learning
,
neural networks
,
convolutional neural networks
,
recurrent neural networks
,
LSTM neural networks
Podobna dela
Podobna dela v RUL:
Vpliv izražanja receptorja za inzulinu podoben rastni dejavnik 1 (IGF1R) na preživetje pri razsejanem nedrobnoceličnem raku pljuč
Metastatic EMT phenotype is governed by microRNA-200-mediated competing endogenous RNA networks
Role of cysteine cathepsins B and X and their inhibitors in epithelial-mesenchymal transition of tumor cells
Isolation and characterization of cancer stem cells from breast cancer cell lines and evaluation of their cathepsin B and X expressions
Določanje prisotnosti krožečih tumorskih celic v periferni krvi bolnikov po RO-resekciji raka debelega črevesa in danke
Podobna dela v drugih slovenskih zbirkah:
Trans-esophageal endobronchial ultrasound-guided needle aspiration (EUS-B-NA)
Multicenter evaluation of the fully automated PCR-based Idylla EGFR Mutation Assay on formalin-fixed, paraffin-embedded Q1 tissue of human lung cancer
Non-small cell lung cancer in countries of Central and Southeastern Europe
Epidermal growth factor receptor mutations and treatment of non-small-cell lung cancer
Novosti v zdravljenju pljučnega raka ASCO, Chicago, 1.-5. junij 2012
Nazaj