Razširjenost biomedicinske literature o možganski kapi predstavlja izziv zaradi preobremenjenosti z informacijami, kar otežuje sistematično raziskovanje in odkrivanje novih spoznanj. Grafi znanja (KG) ponujajo rešitev s strukturiranjem neurejenega besedila v strojno berljivo obliko, vendar je gradnja kakovostnih, specifičnih grafov znanja še vedno težka. Diplomsko delo analizira štiri različne metode gradnje KG, ki zajemajo tri paradigme: na osnovi pravil (OpenIE), nadzorovanega učenja (REBEL, ReLiK) ter metodo, ki temelji na velikih jezikovnih modelih (LLM; Gemma 2 9B). Z uporabo novega korpusa z več kot 433.000 povzetki iz zbirke PubMed ugotavljamo najučinkovitejši pristop za področje možganske kapi. Ključni prispevek predstavlja nov način vrednotenja "LLM kot sodnik'', ki ocenjuje kakovost izluščenih informacij na podlagi 10 klinično podprtih kriterijev, s čimer presega tradicionalne metrike in meri dejansko pravilnost, relevantnost ter uporabnost informacij. Rezultati zagotavljajo jasen primerjalni vpogled v analizirane metode in ponujajo praktično usmeritev za razvoj celovitega grafa znanja StrokeKG, ki bo pospešil prihodnje raziskave in klinično odločanje.
|