Ensuring Face Consistency and Image Naturalness in Multi-Person Image Generation with Diffusion Models

Žakelj, Mark

Podrobno

Ensuring Face Consistency and Image Naturalness in Multi-Person Image Generation with Diffusion Models
ID Žakelj, Mark (Avtor), ID Marolt, Matija (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (11,01 MB)
MD5: C9A9E18D1D5E92A462CABB7AED4DB451

Izvleček

Diffusion models have been widely used for consistent subject generation, but current methods are mostly focused on consistency of a single subject in an image, while consistent multi-subject generation remains an unexplored problem. We propose a method that combines diffusion models with IP-Adapters for facial consistency, ControlNet for ensuring image variability, and facial inpainting for improved facial quality and consistency. We introduce our own module for facial matching, which improves prompt adherence in cases where the age of the subjects varies significantly or their gender is different. Our method produces images of great quality with facial consistency limited only by the underlying IP-Adapter methods.

Jezik:	Angleški jezik
Ključne besede:	Diffusion models, Image generation, Facial consistency
Vrsta gradiva:	Magistrsko delo/naloga
Tipologija:	2.09 - Magistrsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2024
PID:	20.500.12556/RUL-165288
COBISS.SI-ID:	218108675
Datum objave v RUL:	29.11.2024
Število ogledov:	417
Število prenosov:	152
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Slovenski jezik
Naslov:	Zagotavljanje doslednosti obrazov in naravnosti slik pri generiranju večih oseb z difuzijskimi modeli
Difuzijski modeli se pogosto uporabljajo za dosledno generiranje subjektov, vendar so trenutne metode večinoma osredotočene na doslednost enega subjekta na sliki, medtem ko dosledno generiranje več subjektov ostaja neraziskan problem. Predlagamo metodo, ki združuje difuzijske modele z IP-Adapterji za doslednost obrazov, ControlNet-om za zagotavljanje variabilnosti slik ter Face Inpaint-om za izboljšanje kakovosti in doslednosti obraza. Uvedli smo tudi lasten modul za ujemanje obrazov, ki izboljša ujemanje slik in pripadajočega teksta v primerih, ko se starost referenčnih subjektov bistveno razlikuje ali je spol subjektov različen. Naša metoda generira slike visoke kakovosti, kjer je skladnost obrazov omejena zgolj z uporabljenimi metodami IP-Adapter.
Ključne besede:	Difuzijski modeli, Generiranje slik, Doslednost obrazov

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj