Natančno napovedovanje verjetnosti klika na oglas (angl. click–through rate
oz. CTR prediction) ob strogih časovnih omejitvah dražb v realnem času
(RTB) je ključnega pomena za sodobno programatično oglaševanje. Modeli,
ki poganjajo velike priporočilne sisteme, sicer uspešno izkoriščajo kategorične
značilke visokih kardinalnosti, vendar pogosto spregledajo bogate semantične
signale, ki jih vsebujejo oglasi in kontekst spletnih strani. Ta omejitev je še
posebej opazna, ko v sistem pride nova kreativa (t.i. problem hladnega zag-
ona). V tej diplomski nalogi sistematično raziščemo vključevanje slikovnih
in besedilnih vložitev v produkcijske CTR modele. Predstavimo tri strate-
gije združevanja modalnosti (zgodnjo, vmesno in pozno), razvijemo shemo
učenja z več optimizatorji za vsako posamezno podmnožico parametrov, kar
zmanjša porabo pomnilnika za približno trikrat ter število potrebnih op-
eracij za približno petkrat, in uvedemo novo arhitekturo Aligned Deep&
Cross (A-DCN). Empirični poskusi, izvedeni na obsežnem realnem naboru
podatkov, kažejo izboljšave do +0,69% relativnega informacijskega pribitka
(RIG) v primerjavi z močno optimiziranim produkcijskim modelom. Predla-
gani pristopi tako ponujajo praktično izvedljive rešitve za učinkovito multi-
modalno napovedovanje CTR v velikih priporočilnih sistemih.
|