Evaluation of Knowledge Graph Construction Methods on the Stroke Domain

Atanasovska, Elena

Podrobno

Evaluation of Knowledge Graph Construction Methods on the Stroke Domain
ID Atanasovska, Elena (Avtor), ID Robnik Šikonja, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu

, ID Kocev, Dragi (Komentor), ID Koloski, Boshko (Komentor)

PDF - Predstavitvena datoteka, prenos (1021,47 KB)
MD5: 0E393C92A60F5443AC6BEB51D730174D

Izvleček

The proliferation of biomedical literature on stroke creates a severe information-overload problem that hinders systematic research and discovery. Knowledge graphs (KGs) can address this by structuring unstructured text into machine-readable form, yet building high-quality, domain-specific KGs remains difficult. This thesis presents a systematic evaluation of four KG construction methods spanning three paradigms: rule-based (OpenIE), supervised (REBEL, ReLiK), and LLM-based (Gemma 2 9B), using a novel corpus of more than 433k PubMed abstracts. A key contribution is a new "LLM-as-a-judge'' evaluation framework that scores extracted facts on 10 clinically informed criteria, moving beyond traditional structural metrics to assess factual correctness, clinical relevance, and utility. The results benchmark these methods and provide a roadmap for building a comprehensive StrokeKG to accelerate future research and clinical decision-making.

Jezik:	Angleški jezik
Ključne besede:	Knowledge Graph Construction, Relation Extraction, Large Language Models, Biomedical Natural Language Processing
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2026
PID:	20.500.12556/RUL-180960
COBISS.SI-ID:	275585283
Datum objave v RUL:	20.03.2026
Število ogledov:	155
Število prenosov:	48
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Slovenski jezik
Naslov:	Vrednotenje metod za gradnjo grafov znanja na področju možganske kapi
Razširjenost biomedicinske literature o možganski kapi predstavlja izziv zaradi preobremenjenosti z informacijami, kar otežuje sistematično raziskovanje in odkrivanje novih spoznanj. Grafi znanja (KG) ponujajo rešitev s strukturiranjem neurejenega besedila v strojno berljivo obliko, vendar je gradnja kakovostnih, specifičnih grafov znanja še vedno težka. Diplomsko delo analizira štiri različne metode gradnje KG, ki zajemajo tri paradigme: na osnovi pravil (OpenIE), nadzorovanega učenja (REBEL, ReLiK) ter metodo, ki temelji na velikih jezikovnih modelih (LLM; Gemma 2 9B). Z uporabo novega korpusa z več kot 433.000 povzetki iz zbirke PubMed ugotavljamo najučinkovitejši pristop za področje možganske kapi. Ključni prispevek predstavlja nov način vrednotenja "LLM kot sodnik'', ki ocenjuje kakovost izluščenih informacij na podlagi 10 klinično podprtih kriterijev, s čimer presega tradicionalne metrike in meri dejansko pravilnost, relevantnost ter uporabnost informacij. Rezultati zagotavljajo jasen primerjalni vpogled v analizirane metode in ponujajo praktično usmeritev za razvoj celovitega grafa znanja StrokeKG, ki bo pospešil prihodnje raziskave in klinično odločanje.
Ključne besede:	gradnja grafov znanja, luščenje relacij, veliki jezikovni modeli, biomedicinska obdelava naravnega jezika

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj