Izboljšava kvalitete generiranih slik z uporabo modelov za translacijo med slikami

TANKO, URBAN

Izboljšava kvalitete generiranih slik z uporabo modelov za translacijo med slikami
ID TANKO, URBAN (Avtor), ID Skočaj, Danijel (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (12,15 MB)
MD5: C9617FCE10CED2E7FEEBE8EBC724EE14

Izvleček

Pri generiranju slik se vse več uporabljajo metode GAN. Ena od slabosti je dolgotrajnost njihovega učenja. V diplomski nalogi jo poskusimo odpraviti z uporabo modelov za translacijo med slikami, s katerimi želimo izboljšati kvaliteto generiranih slik. To storimo tako, da zberemo podatkovno množico in na njej naučimo model za generiranje slik StyleGAN. Generirane slike nato poženemo skozi naslednje modele za translacijo med slikami: SR-GAN, Pix2pix, CycleGAN, Pix2pixHD, U-GAT-IT in DeblurGAN. Za vsakega od modelov opišemo generirane slike in jih ocenimo z metriko FID ter človeško oceno, pridobljeno z uporabo ankete. Pridobljene rezultate tudi primerjamo med seboj.

Jezik:	Slovenski jezik
Ključne besede:	strojno učenje, umetna inteligenca, nevronske mreže, generativne nasprotniške mreže, translacija med slikami, podatkovna množica, ekstrakcija podatkov
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2020
PID:	20.500.12556/RUL-114979
COBISS.SI-ID:	1538565827
Datum objave v RUL:	06.04.2020
Število ogledov:	1429
Število prenosov:	260
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Improving the quality of generated images using image-to-image translation models
The application of GAN methods for the purpose of image synthesis has grown considerably. One of their weaknesses is long training time. In this thesis we try to eliminate it by using image-to-image translation models to improve generated image quality. We first gather our dataset and train an image synthesis model StyleGAN. We then feed the generated images into various image-to-image translation models: SR-GAN, Pix2pix, CycleGAN, Pix2pixHD, U-GAT-IT in DeblurGAN. For each of the models we describe the visual properties of generated images. We also calculate the FID scores and human scores, obtained with a survey. At the end we compare the results of the models.
Ključne besede:	machine learning, artificial intelligence, neural networks, generative adversarial networks, image-to-image translation, dataset, data scraping

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj