Odkrivanje skupin s pomočjo argumentiranega strojnega učenja

Peter, Šaponja

Odkrivanje skupin s pomočjo argumentiranega strojnega učenja
ID Peter, Šaponja (Avtor), ID Guid, Matej (Mentor) Več o mentorju... Povezava se odpre v novem oknu

URL - Predstavitvena datoteka, za dostop obiščite http://eprints.fri.uni-lj.si/3173/ Povezava se odpre v novem oknu

Izvleček

Potrebe po izboljšanju odkrivanja skupin (angl. clustering) v podatkih dandanes vedno bolj zahtevajo možnost interakcije z domenskimi strokovnjaki, kar je vodilo do razvoja algoritmov odkrivanja skupin z omejitvami (angl. constrained clustering). Ti algoritmi uporabljajo domensko znanje v obliki pozitivnih (angl. must-link) in negativnih omejitev (angl. cannot-link) na pare učnih primerov, kar omogoča izboljšanje procesa odkrivanja skupin. Med slabo raziskanimi problemi na tem področju pa je sama učinkovitost procesa zajemanja omejitev. Postopek zajemanja omejitev lahko pomembno vpliva na kakovost odkrivanja skupin z omejitvami, vendar je tipično zelo zahteven celo za domenske strokovnjake. V magistrskem delu smo zasnovali in razvili metodo voditeljev z argumenti (angl. Argument–based k–means, AB k-means), ki je namenjena učinkovitemu odkrivanju skupin in temelji na paradigmi argumentiranega strojnega učenja. Pri iterativni zanki za zajemanje znanja s pomočjo argumentiranega strojnega učenja domenski strokovnjak s pojasnjevanjem avtomatsko izbranih problematičnih primerov vnaša domensko znanje, metoda pa nato s pomočjo ”protiprimerov” izpostavlja morebitne pomanjkljivosti strokovnjakovih razlag in mu omogoča izboljševanje podanih argumentov. Omenjeno iterativno zanko smo prilagodili potrebam odkrivanja skupin, tako da nova metoda z izpostavljanjem slabše in bolje umeščenih primerov v skupine tekom postopka zajemanja znanja iz domenskega strokovnjaka pridobi omejitve, ki so ključne za izboljšanje rezultatov odkrivanja skupin. Hkrati pa pridobljene omejitve vodijo do oblikovanja skupin, ki so skladne s strokovnjakovim znanjem v izbrani domeni. Razvili smo tudi aplikacijo za interaktivno odkrivanje skupin s pomočjo novo razvite metode. Učinkovitost našega pristopa smo empirično ovrednotili na treh eksperimentalnih domenah s pomočjo primerjave z običajnim algoritmom za odkrivanje skupin z omejitvami in pri tem dobili spodbudne rezultate.

Jezik:	Neznan jezik
Ključne besede:	delno nadzorovano učenje, odkrivanje skupin, grupiranje, metoda voditeljev, odkrivanje skupin z omejitvami, argumentirano strojno učenje, iterativna zanka za zajemanje znanja, zajemanje omejitev, metoda voditeljev z argumenti
Vrsta gradiva:	Magistrsko delo/naloga
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2015
PID:	20.500.12556/RUL-72823
COBISS.SI-ID:	1536580803
Datum objave v RUL:	03.10.2015
Število ogledov:	1491
Število prenosov:	246
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Neznan jezik
Naslov:	Clustering with Argument-Based Machine Learning
The need for improvement of data clustering methods demanded more interactive options with domain experts, which led to the development of algorithms, coined as constrained clustering. These algorithms use domain knowledge in the form of positive must-link and negative cannot-link constraints to improve the quality of detected groups. One of the most overlooked issues in this filed is the effectiveness of constraint elicitation. While the process of constraint elicitation can be a tedious task it can have a significant impact on the quality of clustering. In this thesis we designed and developed a method named Argument-based k-means (AB k-means), which is designed for a more efficient clustering and is based on the paradigm of argument-based machine learning (ABML). The knowledge refinement loop enables the domain expert to articulate his domain knowledge by argumenting automatically chosen problematic cases, while the method with the help of counter examples highlights any shortcomings in the expert’s arguments. We adapted the knowledge refinement loop to the needs of clustering by exposing badly and well clustered cases when eliciting constraints, which are crucial for the improvement of clustering. At the same time the obtained constraints lead to clusters that are consistent with the knowledge of the expert in their chosen domain. For an easier use of the new method we have also developed an interactive application. The effectiveness of our approach was empirically tested on three different experimental domains and compared favourably with an ordinary algorithm for constrained clustering.
Ključne besede:	semi-supervised learning, clustering, k-means, constrained clustering, argument-based machine learning, knowledge refinement loop, constraint elicitation, argument-based k-means

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj