Konstrukcija značilk lahko prispeva k razumljivosti in učinkovitosti modelov strojnega učenja. Vendar pa je za generiranje smiselnih značilk običajno potrebno izvesti izčrpno preiskovanje prostora atributov ali pa vključiti domenskega eksperta, kar je časovno potratno. V tej disertaciji se ukvarjamo s tem izzivom in predlagamo nov hevristični pristop za zmanjšanje preiskovalnega prostora, ki temelji na združevanju razlag primerov napovednih modelov.
V disertaciji predstavimo učinkovito metodo za konstrukcijo razložljivih značilk, imenovano EFC (Explainable Feature Construction), ki deluje tako na klasifikacijskih kot na regresijskih problemih. Metoda vključuje štiri korake: 1) razlago napovedi modela za posamezne primere, 2) določanje skupin atributov, ki se običajno pojavljajo skupaj pri razlagah, 3) učinkovito gradnjo konstruktov iz identificiranih skupin in 4) ocenjevanje konstruktov in izbor najboljših kot nove značilke. Metoda EFC skrajša čas konstrukcije značilk in izboljša napovedno uspešnost za več klasifikatorjev na standardnih podatkovnih množicah, poleg tega pa je bila verodostojnost generiranih značilk na realni domeni potrjena z domenskim ekspertom.
Razumevanje modelov strojnega učenja je ključno za izboljšanje njihove uporabnosti in zagotavljanje zanesljivih rezultatov. To lahko dosežemo z razvojem interpretabilnih modelov in z uporabo razlagalnih metod. Ene izmed učinkovitih razlagalnih metod so perturbacijske metode, ki omogočajo razumevanje modela na podlagi sprememb izhodnih rezultatov modela, ki se pojavijo ob spreminjanju vhodnih podatkov. V disertaciji predstavimo uporabo perturbacijskih metod kot pomoč pri zmanjševanju preiskovalnega prostora ter posledično identifikaciji informativnih skupin atributov.
Glavni prispevek disertacije je inovativna hevristična metoda za zmanjšanje preiskovalnega prostora pri konstruktivni indukciji, ki temelji na razlagah napovednih modelov. Metoda omogoča generiranje informativnih skupin kandidatov za konstrukte, ki vključujejo skupine atributov, ki se pogosto pojavljajo v lokalnih razlagah modelov črne škatle. Te skupine se uporabijo za generiranje smiselnih razložljivih značilk, ki izboljšajo napovedne uspešnosti več klasifikatorjev. S pomočjo te metode se precej zmanjša računska zahtevnost preiskovanja, hkrati pa se omogoča učinkovito vključevanje domenskega eksperta, kar prispeva k večji razumljivosti napovednih modelov.
|