Primerjava metod diskretizacije za gradnjo povezovalnih pravil

Barašin, Irina

Primerjava metod diskretizacije za gradnjo povezovalnih pravil
ID Barašin, Irina (Avtor), ID Vračar, Petar (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (1,66 MB)
MD5: 4FE5C3F171FC6FF32C6625C3A3348334

Izvleček

V diplomskem delu raziskujemo uporabo različnih metod diskretizacije v kombinaciji z algoritmoma Apriori in FP-growth za rudarjenje povezovalnih pravil na umetnih in realnih podatkovnih množicah. Poseben poudarek je bil namenjen preučevanju vpliva diskretizacije numeričnih atributov na kakovost in interpretabilnost generiranih pravil, z uporabo različnih mer zanimivosti, kot so chi kvadrat, dvig, priklic in napovedna točnost. Analiza je pokazala, da je metoda relativne nenadzorovane diskretizacije (RUDE) učinkovita pri prepoznavanju pravil, ki vključujejo diskretizirane atribute, medtem ko so ostale predvsem odkrivale splošno znana pravila, sestavljena iz kategoričnih atributov. Poleg tega je bilo ugotovljeno, da kombinacija metod diskretizacije in mer zanimivosti pomembno vpliva na ocene pravil, tudi tistih, ki vključujejo zgolj kategorične atribute. To delo prispeva k razumevanju vpliva diskretizacije na rudarjenje pravil in odpira možnosti za nadaljnje raziskave na tem področju.

Jezik:	Slovenski jezik
Ključne besede:	strojno učenje, povezovalna pravila, nenadzorovano strojno učenje, diskretizacija, podatkovna znanost
Vrsta gradiva:	Diplomsko delo/naloga
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2024
PID:	20.500.12556/RUL-161605
Datum objave v RUL:	12.09.2024
Število ogledov:	58
Število prenosov:	275
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Comparison of Discretization Techniques for Association Rules Mining
In thesis we explore the application of various discretization methods combined with the Apriori and FP-growth algorithms for mining association rules on artificial and real datasets. Special emphasis was placed on examining the impact of discretizing numerical attributes on the quality and interpretability of the generated rules, using different interestingness measures such as chi kvadrat, lift, recall, and accuracy. The analysis revealed that the Relative Unsupervised Discretization (RUDE) method proved effective in identifying rules involving discretized attributes, while other primarily uncovered well-known, general rules made of categorical atributes. Additionally, it was found that the combination of discretization methods and interestingness metrics significantly influenced the evaluations of rules, even those involving purely categorical attributes. This work contributes to understanding the impact of discretization on rule mining and opens up possibilities for future research in this area.
Ključne besede:	machine learning, association rules, unsupervised machine learning, discretization, data science

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj