izpis_h1_title_alt

Hierarhično gručenje na velikih podatkih
ID Debevec, Nejc (Avtor), ID Zupan, Blaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (3,70 MB)
MD5: DED0A2944FCDE5662DE870448D529EBA

Izvleček
Hierarhično gručenje je zelo priljubljena in uporabna metoda gručenja. Omogoča nam gradnjo informativne vizualizacije hierarhij v podatkih imenovano dendrogram. Težava se pojavi pri obdelavi večjih količin podatkov, saj ima metoda visoko časovno in prostorsko zahtevnost. V magistrskem delu predstavimo pristop za zmanjšanje kompleksnosti metode hierarhičnega gručenja. Ta temelji na preobdelavi podatkov s hitrejšimi tehnikami gručenja. V ta namen preizkusimo metode: DBSCAN, BIRCH, MeanSHift, metoda voditeljev in pa gručenje v omrežjih. Vsako izmed metod preizkusimo na različnih sintetičnih in realnih podatkovnih množicah. Prav tako podamo idejno vizualizacijo za prikaz rezultatov našega pristopa. Iz rezultatov je razvidno, da z našim pristopom bistveno časovno izboljšamo metodo hierarhičnega gručenja, vendar pri tem izgubimo pri natančnosti. Naš pristop namreč ne vrača popolnoma istih rezultatov, kot metoda hierarhičnega gručenja.

Jezik:Slovenski jezik
Ključne besede:odkrivanje znanj iz podatkov, razvrščanje v skupine, hierarhično gručenje, vizualizacija podatkov
Vrsta gradiva:Magistrsko delo/naloga
Tipologija:2.09 - Magistrsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2020
PID:20.500.12556/RUL-124149 Povezava se odpre v novem oknu
COBISS.SI-ID:51746051 Povezava se odpre v novem oknu
Datum objave v RUL:07.01.2021
Število ogledov:1157
Število prenosov:223
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Hierarchical Clustering for Large Data Sets
Izvleček:
Hierarchical clustering is a very popular and useful clustering method. It allows us to build an informative visualization of hierarchies in data called a dendrogram. The problem arises when processing large amounts of data, as the method has a high time and space complexity. In the master's thesis, we present an approach to reducing the complexity of the method of hierarchical clustering. This is based on data processing with faster clustering techniques. For this purpose, we test the methods: DBSCAN, BIRCH, MeanShift, K-means and Louvain clustering. Each of the methods is tested on different synthetic and real data sets. We also provide a conceptual visualization to show the results of our approach. It is evident from the results that our approach significantly improves the time complexity of the method of hierarchical clustering, but we do lose accuracy. Namely, our approach does not return exactly the same results as the method of hierarchical clustering.

Ključne besede:data mining, clustering, hierarchical clustering, data visualization

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj