Veliki jezikovni modeli hitro spreminjajo informacijske sisteme in vse bolj prispevajo k ustvarjanju ter širjenju spletnih vsebin. V kontekstu družbenih medijev, kjer so objave in agenti, ki jih ustvarja umetna inteligenca, vse bolj razširjeni, ostaja razumevanje, kako se LLM-i vedejo in prilagajajo v okviru družbenih grafov, večinoma neraziskano, zlasti v dinamičnih, procesno zasnovanih kontekstih, ki jih preučuje omrežna znanost. Obstoječe raziskave o procesih difuzije in vpliva pogosto temeljijo na pretirano poenostavljenih, enodimenzionalnih modelih vedenja uporabnikov ter zanemarjajo bogato družbeno in jezikovno dinamiko realnih interakcij.
V tej magistrski nalogi predstavljamo novo ogrodje za družbeno ozaveščeno poravnavo (ang. socially aware alignment) velikih jezikovnih modelov, ki združuje jezikovno modeliranje z dinamiko širjenja informacij v omrežjih. Najprej analiziramo vdelani prostor družbenih dimenzij in pokažemo, da so dimenzije, kot so zaupanje, konflikt in podpora, zmerno korelirane, nato pa prostor razširimo z dodatnimi klasifikatorji za zaznavanje stališč. Na tej osnovi predlagamo posplošitev binarnega kaskadnega modela (BCM), ki vključuje večdimenzionalne, družbeno utemeljene predstavitve uporabnikov. Za učinkovito optimizacijo razvijemo formulacijo nagrade, ki izkorišča strukturo aktivnega nabora med širjenjem, kar omogoča skalabilno učenje. Celoten postopek spodbujevanega učenja uporablja metodo PPO (Proximal Policy Optimization), s katero poravnamo generativno vedenje velikega jezikovnmega modela z družbenim kontekstom omrežja.
Ogrodje je temeljito ovrednoteno tako na sintetičnih grafih, ustvarjenih z nadzorovanimi značilnostmi in strukturami skupnosti, kot tudi na dejanskih podatkih iz Twitter($X$) razprave o Brexitu. Rezultati kažejo, da predlagana metoda poravnave uspešno modelira realistične dinamike širjenja informacij, obenem pa razkriva notranje pristranskosti velikih jezikovnih modelov do določenih stališč in nestabilnosti v močno polariziranih okoljih.
Ugotovitve imajo dvojne posledice: s tehničnega vidika pristop predstavlja napredek na področju socialno informirane poravnave jezikovnih modelov za aplikacije, kot so javno komuniciranje in informacijske kampanje; z etičnega vidika pa opozarjaja na tveganje o morebitni zlorabi za manipulacijo z javnim mnenjem. Nadaljnje delo se bo osredotočilo na izboljšanje stabilnosti metode PPO, povečanje predvidljivosti nagrade in raziskovanje večjih arhitektur velikh jezikovnih modelov za doseganje robustnejšega družbeno poravnanega vedenja.
|