izpis_h1_title_alt

Poenostavitev dreves hierarhičnega gručenja
ID FILIPOVIČ, ROK (Avtor), ID Zupan, Blaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (3,32 MB)
MD5: 8468DC63FF33578C60E8CFACEBE1376C

Izvleček
Rezanje dreves hierarhičnega gručenja je pomemben proces, vendar je zelo težko oceniti, kje smemo rezati, da izbrana gruča res predstavlja povezavo med svojimi predstavniki. Algoritem, ki nam pomaga to doseči, je pvclust. Za generiranje vzorcev uporablja metodo stremena, ti vzorci pa se nato uporabijo za izračun korelacijskega koeficienta med pari posameznih atributov. Koeficienti se uporabijo kot mera, ki pomaga določiti razdalje med atributi, ki so ključne za delovanje hierarhičnega gručenja. Med iteracijami algoritem primerja gruče in skuša ugotoviti, katere gruče najverjetneje predstavljajo dejanske povezave med atributi. Vendar pa je ena od težav algoritma ta, da za svoje delovanje zahteva veliko časa. Zato v tej nalogi predstavimo alternativo, ki bi dosegla podobne rezultate, vendar bi zahtevala veliko manj časa. Kot kažejo rezultati, nam je z metodo silhuet uspelo izpolniti željen cilj.

Jezik:Slovenski jezik
Ključne besede:Hierarhično gručenje, dendrogrami, pvclust, metoda stremena.
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
FMF - Fakulteta za matematiko in fiziko
Leto izida:2023
PID:20.500.12556/RUL-150460 Povezava se odpre v novem oknu
COBISS.SI-ID:169193731 Povezava se odpre v novem oknu
Datum objave v RUL:18.09.2023
Število ogledov:1318
Število prenosov:50
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Simplification of hierarchical clustering trees
Izvleček:
Tree cutting is an important aspect of hierarchical clustering, however, de- termining where to cut often poses a problem, as we would like the clusters to actually represent connections between the objects. An algorithm that helps us achieve this is pvclust. It generates samples through the bootstrap method, which are then used to calculate the correlation between pairs of in- dividual attributes. These values serve as a measure to determine distances that are crucial in hierarchical clustering. Throughout all iterations, the al- gorithm compares which clusters are likely to represent actual connections between features. The only issue is that the algorithm requires a signifi- cant amount of time to operate. Therefore, in this study, we are exploring an alternative that could yield similar results while significantly reducing the required time. Fortunately, it seems that we were able to reproduce sufficient results using the silhouette method.

Ključne besede:Hierarchical clustering, dendrograms, pvclust, bootstrap method.

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj