Sistemi za razpoznavo obrazov dosegajo nadčloveško raven natančnosti, vendar ostajajo neenakomerni med demografskimi skupinami. To delo obravnava demografsko pristranskost s podatkovno usmerjeno metodo: z zamenjavo obrazov ob ohranjeni identiteti gradimo velike sintetične podatkovne zbirke, kjer je vsaka identiteta enakomerno zastopana glede na spol in etnično pripadnost. Z uporabo mreže U-Net s FiLM-pogojevanjem ustvarimo in validiramo podatkovno zbirko z dvema milijonoma slik (na osnovi BUPT-BalancedFace) prek metrik kakovosti obraznih slik in primerjav v vdelavnem prostoru. Nadaljnje prilagajanje modelov ArcFace in AdaFace na teh podatkih zmanjša razlike v napakah med skupinami glede na standardizirane metrike, čeprav deloma na račun natančnosti preverjanja. V primerjavi z nadaljnjim prilagajanjem na realnih uravnoteženih podatkih sintetična razširitev sicer prinaša nižjo absolutno natančnost, a hkrati merljive izboljšave pravičnosti brez obsežnih demografsko označenih podatkov, kar poudarja tako obetavnost kot omejitve sintetičnih podatkov pri omilitvi pristranskosti.
|