Razlaga napovedi strojnega učenja z biološkim predznanjem

DROFENIK, KLARA

Razlaga napovedi strojnega učenja z biološkim predznanjem
ID DROFENIK, KLARA (Avtor), ID Robnik Šikonja, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu

, ID Škrlj, Blaž (Komentor)

PDF - Predstavitvena datoteka, prenos (428,65 KB)
MD5: 2E160D25A499A95ADA69D6A25548DC78

Izvleček

Za naključne gozdove, nevronske mreže in ostale kompleksnejše modele strojnega učenja je težko povedati, zakaj so podali dano napoved. Težavo rešujejo algoritmi, ki poskušajo razložiti vpliv atributov na napoved ciljne spremenljivke. Eden takšnih je algoritem SHAP, ki glede na vrednost atributa poda oceno, kako ta vpliva na napoved modela. Naš cilj je preveriti, kako se razlage SHAP ujemajo s predznanjem. Na več podatkovnih množicah proteinov smo zgradili napovedne modele z metodo XGBoost in ga razložili z algoritmom SHAP. Preverili smo, ali med proteini, ki so pomembni za napovedi modela, obstajajo raziskane interakcije, s pomočjo katerih bi lahko preverili uspešnost algoritma SHAP za iskanje interakcij. Rezultati so se razlikovali glede števila najdenih interakcij za različne učne množice in baze znanja. Naša raziskava nakazuje potencialno uporabnost algoritma SHAP za iskanje interakcij.

Jezik:	Slovenski jezik
Ključne besede:	metoda razlage SHAP, razlaga napovednih modelov, biološko predznanje, napovedni model XGBoost
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko FMF - Fakulteta za matematiko in fiziko
Leto izida:	2021
PID:	20.500.12556/RUL-125528
COBISS.SI-ID:	58202115
Datum objave v RUL:	23.03.2021
Število ogledov:	1233
Število prenosov:	191
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Explanation of machine learning predictions using biological background knowledge
Decisions of complex machine learning algorithms such as random forest and neural networks are difficult to explain. This problem can be addressed with perturbation-based algorithms, such as SHAP, which assigns credit for prediction to individual attribute values. Our goal was to check if the output of SHAP matches the background knowledge. We used the XGBoost model on several data sets, where attributes are proteins, and explained the model with SHAP algorithm. We checked if there are known biological interactions between proteins, which SHAP marks as important. The method could turn SHAP into interaction discovery algorithm. Obtained numbers of interactions differ based on the chosen data set and knowledge base. Our research hints at potential usefulness of explanation algorithm for finding interactions.
Ključne besede:	explanation method SHAP, explanation, biological background, prediction model XGBoost

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj